o1多模态推理终于有了“开源版本”,阿里云通义QVQ一夜爆火
阿里云通义团队发布了开源多模态推理模型QVQ-72B-Preview,该模型具备强大的视觉推理能力,在数学视觉推理测试MathVista中以71.4分略胜o1满血版。它不仅能在复杂场景下准确识别物体(如数鹈鹕),还能解决数学、物理等学科难题。在MMMU评测中,QVQ的表现与Claude3.5相当,远超上一代模型Qwen2-VL。目前,通义千问Qwen在HuggingFace上的相关模型数已突破8.8万,成为全球最大的AI模型群,标志着中国开源大模型取得重要进展。来源:https://mp.weixin.qq.com/s/ujpFYkFc3IseOG3K5hkjDA
页:
[1]