周大 发表于 2024-8-9 16:57:15

CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA

CMU和清华大学的研究者提出了一种名为Lean-STaR的新框架,旨在改善大型语言模型(LLM)的定理证明能力。该框架结合了Lean和STaR两项成果,通过融入“思维链”(Chain of Thought, CoT)原理,显著增强了模型的推理能力。实验结果显示,采用Lean-STaR训练的模型在MiniF2F基准测试上取得了最新最佳性能,将定理证明通过率从30.3%提升至36.1%。
来源:https://mp.weixin.qq.com/s/X6YMmeef4SN5UGXX7muDUw
页: [1]
查看完整版本: CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA