简单蒸馏超越 o1-preview,但代价几何?

[复制链接]
周大 发表于 2024-12-10 14:49:03 | 显示全部楼层 |阅读模式
OpenAI 最近发布了满血版 o1 系列及强化微调技术 RFT,新版本错误率降低 34%,思考速度提升 50%。RFT 仅需少量高质量数据即可微调出专家模型,1100 个数据让 o1-mini 超越 o1。上海交大研究者通过简单的知识蒸馏,使用数万条数据在 AIME2024 评分上超越 o1-preview。论文提出技术透明度指数(TTI),评估复现 o1 模型的透明度,发现大多数团队在数据和方法透明度方面表现不佳。研究者警告过度依赖简单蒸馏可能带来性能上限、技术创新缺失、人才培养负面影响等问题。
来源:https://mp.weixin.qq.com/s/fbL_XS2zhlXjcDczw_bByQ

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-23 19:24 , Processed in 0.269922 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表