智谱AI开源多模态模型CogVLM2,性能超越GPT-4v
智谱AI的多模态模型CogVLM2开源并刷新SOTA记录,其性能在多项指标上超越GPT-4v和Gemini Pro,且只需16GB显存即可运行Int4量化版本。模型支持8K文本和高分辨率图像,且在OCR和文档理解上表现出色,解决了Llama3系列的中文输出难题,提供中英文双语服务,已在GitHub上引发关注。来源:https://mp.weixin.qq.com/s/GWbMmtRJ16RYZEAZFbYC9g
页:
[1]