上海交大团队通过知识蒸馏提升AI数学推理能力

[复制链接]
周大 发表于 2024-11-22 14:37:01 | 显示全部楼层 |阅读模式
上海交通大学GAIR研究团队通过知识蒸馏方法,使Qwen2.5-Math-72B模型在数学推理能力上超越OpenAI的o1-preview。该模型在美国高中数学邀请赛(AIME)等测试中表现优异,同时在安全性、抗幻觉等方面也有显著提升。团队提出技术透明度指数(TTI)框架,评估AI模型复现工作的透明度,最高得分为33分。团队强调培养具有第一性原理思维的AI研究者的重要性,呼吁行业保持创新活力。
来源:https://mp.weixin.qq.com/s/bJc_hSrXsUgrzAfSxAoYoA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-25 21:10 , Processed in 0.295834 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表