周大 发表于 2024-5-22 15:18:27

智谱AI开源多模态模型CogVLM2,性能超越GPT-4v

智谱AI的多模态模型CogVLM2开源并刷新SOTA记录,其性能在多项指标上超越GPT-4v和Gemini Pro,且只需16GB显存即可运行Int4量化版本。模型支持8K文本和高分辨率图像,且在OCR和文档理解上表现出色,解决了Llama3系列的中文输出难题,提供中英文双语服务,已在GitHub上引发关注。
来源:https://mp.weixin.qq.com/s/GWbMmtRJ16RYZEAZFbYC9g
页: [1]
查看完整版本: 智谱AI开源多模态模型CogVLM2,性能超越GPT-4v