Long-CoT 后,推理模型的「思维模板」有哪些新玩法?

[复制链接]
周大 发表于 2025-3-17 15:33:14 | 显示全部楼层 |阅读模式
基于思维链(CoT)的推理模型正在经历从“短程启发”到“长程规划”的范式转变。OpenAI o1、DeepSeek R1 和 Kimi K1.5 等模型在数学证明和复杂决策中展现出接近人类的推理能力。通过长链思维(Long-CoT)模板,模型能够生成更长的推理步骤,增强符号操作能力和错误验证功能。DeepSeek 团队利用简单模板引导模型逐步推理,并通过收集 Long-CoT 数据优化微调与强化学习。此外,Dynasor、LCPO 和 CoD 等创新模板显著降低了计算成本,提升了推理效率。
来源:https://mp.weixin.qq.com/s/1UHMGO01NYlWnAT5ouiCPw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-6 10:35 , Processed in 0.293014 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表