大模型也需要自我反思,上海AI Lab合成“错题本”让大模型数学成绩提升13.3%
上海AI Lab提出的LEMMA方法,通过构建“错误-反思-修正”数据,让大模型像人类一样从错误中学习。该方法利用教师模型生成针对性错误数据,并结合两种纠错策略(返回上一步或推倒重来),显著提升了模型的数学推理能力。实验表明,LEMMA在Llama3-8B上将数学题解题准确率提升了13.3%,并在MathChat任务中大幅领先现有方法。此外,消融实验验证了其关键模块的有效性,相关成果已发表于ACL’25 Findings。来源:https://mp.weixin.qq.com/s/qHATXYDZKzYlXwinlMUFuw
页:
[1]