从正确中学习?大模型的自我纠正新视角

[复制链接]
周大 发表于 2024-9-17 16:18:54 | 显示全部楼层 |阅读模式
香港城市大学与华为诺亚方舟实验室联合提出LeCo方法,通过自我纠正提高大模型推理准确性,无需人类反馈或外部工具。LeCo利用生成logits测量推理步骤置信度,识别错误步骤。实验结果显示,LeCo在逻辑、常识和数学推理任务中显著提升了性能,同时减少了token消耗和迭代次数,适用于不同模型和方法。
来源:https://mp.weixin.qq.com/s/F8KpJuiDE9DfSVb1ciLUSQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 05:55 , Processed in 0.298873 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表