CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
CMU和清华大学的研究者提出了一种名为Lean-STaR的新框架,旨在改善大型语言模型(LLM)的定理证明能力。该框架结合了Lean和STaR两项成果,通过融入“思维链”(Chain of Thought, CoT)原理,显著增强了模型的推理能力。实验结果显示,采用Lean-STaR训练的模型在MiniF2F基准测试上取得了最新最佳性能,将定理证明通过率从30.3%提升至36.1%。来源:https://mp.weixin.qq.com/s/X6YMmeef4SN5UGXX7muDUw
页:
[1]