o1也会「想太多」?腾讯AI Lab与上海交大揭秘o1模型过度思考问题

[复制链接]
周大 发表于 2025-1-8 15:14:26 | 显示全部楼层 |阅读模式
腾讯AI Lab与上海交通大学团队共同研究发现,o1类长思维链模型在处理简单问题时存在“过度思考”现象,导致不必要的计算资源浪费。研究团队通过定义“独立解答”并引入产出效率和过程效率两个量化指标,揭示了这一问题的普遍性。实验表明,这些模型在首次尝试中通常已能得出正确答案,后续多轮思考并无实质贡献。为解决这一问题,研究者提出了一系列优化方法,包括使用偏好优化算法(如SimPO)和多种正样本选择策略,成功减少了冗余推理,提升了推理效率。未来的研究将重点探索自适应调控策略和更精细的效率评估指标,以实现更高效的推理机制。
来源:https://mp.weixin.qq.com/s/ofTfoFNIgGO2ZIsWVnjfAA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-22 00:07 , Processed in 0.281603 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表