CMU清华教LLM练成数学高手，LeanSTaR训练模型边思考边证明，登顶新SOTA

周大发表于 2024-8-9 16:57:15

CMU和清华大学的研究者提出了一种名为Lean-STaR的新框架，旨在改善大型语言模型（LLM）的定理证明能力。该框架结合了Lean和STaR两项成果，通过融入“思维链”（Chain of Thought, CoT）原理，显著增强了模型的推理能力。实验结果显示，采用Lean-STaR训练的模型在MiniF2F基准测试上取得了最新最佳性能，将定理证明通过率从30.3%提升至36.1%。
来源：https://mp.weixin.qq.com/s/X6YMmeef4SN5UGXX7muDUw

页: [1]

靠浦ai课堂's Archiver

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思考边证明，登顶新SOTA