智谱AI开源多模态模型CogVLM2,性能超越GPT-4v

[复制链接]
周大 发表于 2024-5-22 15:18:27 | 显示全部楼层 |阅读模式
智谱AI的多模态模型CogVLM2开源并刷新SOTA记录,其性能在多项指标上超越GPT-4v和Gemini Pro,且只需16GB显存即可运行Int4量化版本。模型支持8K文本和高分辨率图像,且在OCR和文档理解上表现出色,解决了Llama3系列的中文输出难题,提供中英文双语服务,已在GitHub上引发关注。
来源:https://mp.weixin.qq.com/s/GWbMmtRJ16RYZEAZFbYC9g

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-8 05:07 , Processed in 0.283016 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表