o1多模态推理终于有了“开源版本”，阿里云通义QVQ一夜爆火

周大发表于 2024-12-27 16:03:56

阿里云通义团队发布了开源多模态推理模型QVQ-72B-Preview，该模型具备强大的视觉推理能力，在数学视觉推理测试MathVista中以71.4分略胜o1满血版。它不仅能在复杂场景下准确识别物体（如数鹈鹕），还能解决数学、物理等学科难题。在MMMU评测中，QVQ的表现与Claude3.5相当，远超上一代模型Qwen2-VL。目前，通义千问Qwen在HuggingFace上的相关模型数已突破8.8万，成为全球最大的AI模型群，标志着中国开源大模型取得重要进展。
来源：https://mp.weixin.qq.com/s/ujpFYkFc3IseOG3K5hkjDA

页: [1]

靠浦ai课堂's Archiver

o1多模态推理终于有了“开源版本”，阿里云通义QVQ一夜爆火