简单蒸馏超越 o1-preview，但代价几何？

周大发表于 2024-12-10 14:49:03

OpenAI 最近发布了满血版 o1 系列及强化微调技术 RFT，新版本错误率降低 34%，思考速度提升 50%。RFT 仅需少量高质量数据即可微调出专家模型，1100 个数据让 o1-mini 超越 o1。上海交大研究者通过简单的知识蒸馏，使用数万条数据在 AIME2024 评分上超越 o1-preview。论文提出技术透明度指数（TTI），评估复现 o1 模型的透明度，发现大多数团队在数据和方法透明度方面表现不佳。研究者警告过度依赖简单蒸馏可能带来性能上限、技术创新缺失、人才培养负面影响等问题。
来源：https://mp.weixin.qq.com/s/fbL_XS2zhlXjcDczw_bByQ

		自动登录	找回密码
密码			立即注册

课程导航

简单蒸馏超越 o1-preview，但代价几何？