o1多模态推理终于有了“开源版本”,阿里云通义QVQ一夜爆火

[复制链接]
周大 发表于 2024-12-27 16:03:56 | 显示全部楼层 |阅读模式
阿里云通义团队发布了开源多模态推理模型QVQ-72B-Preview,该模型具备强大的视觉推理能力,在数学视觉推理测试MathVista中以71.4分略胜o1满血版。它不仅能在复杂场景下准确识别物体(如数鹈鹕),还能解决数学、物理等学科难题。在MMMU评测中,QVQ的表现与Claude3.5相当,远超上一代模型Qwen2-VL。目前,通义千问Qwen在HuggingFace上的相关模型数已突破8.8万,成为全球最大的AI模型群,标志着中国开源大模型取得重要进展。
来源:https://mp.weixin.qq.com/s/ujpFYkFc3IseOG3K5hkjDA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-22 11:56 , Processed in 0.264701 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表