Long-CoT 后，推理模型的「思维模板」有哪些新玩法？

周大发表于 2025-3-17 15:33:14

基于思维链（CoT）的推理模型正在经历从“短程启发”到“长程规划”的范式转变。OpenAI o1、DeepSeek R1 和 Kimi K1.5 等模型在数学证明和复杂决策中展现出接近人类的推理能力。通过长链思维（Long-CoT）模板，模型能够生成更长的推理步骤，增强符号操作能力和错误验证功能。DeepSeek 团队利用简单模板引导模型逐步推理，并通过收集 Long-CoT 数据优化微调与强化学习。此外，Dynasor、LCPO 和 CoD 等创新模板显著降低了计算成本，提升了推理效率。
来源：https://mp.weixin.qq.com/s/1UHMGO01NYlWnAT5ouiCPw

页: [1]

靠浦ai课堂's Archiver

Long-CoT 后，推理模型的「思维模板」有哪些新玩法？