三思而后行,让大模型推理更强的秘密是「THINK TWICE」?

[复制链接]
周大 发表于 2025-4-5 14:59:46 | 显示全部楼层 |阅读模式
a-m-team 团队提出「Think Twice」方法,通过多轮推理优化大语言模型性能,无需额外训练或复杂机制。该方法模仿人类反思过程,以结果驱动的方式逐步修正模型偏误,有效缓解“认知惯性”。实验表明,在 AIME、MATH-500 等数据集上,DeepSeek-R1 和 QwQ-32B 等模型准确率显著提升,同时语言风格更简洁自信。这种方法实用性强,为模型部署及未来研究提供了新思路。
来源:https://mp.weixin.qq.com/s/xCN70_gwjkRTAh7nWdtggA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 20:56 , Processed in 0.286569 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表