大模型也需要自我反思，上海AI Lab合成“错题本”让大模型数学成绩提升13.3%

周大发表于 2025-6-18 14:51:36

上海AI Lab提出的LEMMA方法，通过构建“错误-反思-修正”数据，让大模型像人类一样从错误中学习。该方法利用教师模型生成针对性错误数据，并结合两种纠错策略（返回上一步或推倒重来），显著提升了模型的数学推理能力。实验表明，LEMMA在Llama3-8B上将数学题解题准确率提升了13.3%，并在MathChat任务中大幅领先现有方法。此外，消融实验验证了其关键模块的有效性，相关成果已发表于ACL’25 Findings。
来源：https://mp.weixin.qq.com/s/qHATXYDZKzYlXwinlMUFuw

页: [1]

靠浦ai课堂's Archiver

大模型也需要自我反思，上海AI Lab合成“错题本”让大模型数学成绩提升13.3%