周大 发表于 2024-8-9 16:48:47

通义千问开源数学模型Qwen2-Math 测评得分超GPT-4o

阿里通义团队发布Qwen2-Math数学模型,包括三种不同规模的基础模型及指令微调模型。该模型基于Qwen2研发,其中旗舰版本Qwen2-Math-72B-Instruct在MATH评测集上以84%的准确率领先GPT-4o、Claude-3.5-Sonnet等竞争对手,展现出了在解决多种数学问题方面的强大能力。
来源:https://tech.ifeng.com/c/8buAOaPNULQ
页: [1]
查看完整版本: 通义千问开源数学模型Qwen2-Math 测评得分超GPT-4o