全面增强LLM推理/规划/执行力！北航提出全新「内置CoT」思考方法

周大发表于 2025-3-4 15:30:37

国内学者提出基于内置思维链的思考方法，解决了大语言模型在多轮对话中存在的推理和计划能力不足问题。该方法包含五个思考要素，并引入一致性奖励模型以增强训练效果。实验表明，使用该方法后的大语言模型在推理、计划和执行方面表现更好。此外，研究还提出了局部思考上下文和行动调用机制，提高了模型与环境交互的效率。这一创新为大语言模型的发展提供了新的研究方向。
来源：https://mp.weixin.qq.com/s/LVwCjuOki2ocdCFwPQ0POw

页: [1]

靠浦ai课堂's Archiver

全面增强LLM推理/规划/执行力！北航提出全新「内置CoT」思考方法