Long-CoT 后,推理模型的「思维模板」有哪些新玩法?
基于思维链(CoT)的推理模型正在经历从“短程启发”到“长程规划”的范式转变。OpenAI o1、DeepSeek R1 和 Kimi K1.5 等模型在数学证明和复杂决策中展现出接近人类的推理能力。通过长链思维(Long-CoT)模板,模型能够生成更长的推理步骤,增强符号操作能力和错误验证功能。DeepSeek 团队利用简单模板引导模型逐步推理,并通过收集 Long-CoT 数据优化微调与强化学习。此外,Dynasor、LCPO 和 CoD 等创新模板显著降低了计算成本,提升了推理效率。来源:https://mp.weixin.qq.com/s/1UHMGO01NYlWnAT5ouiCPw
页:
[1]