从正确中学习？大模型的自我纠正新视角

周大发表于 2024-9-17 16:18:54

香港城市大学与华为诺亚方舟实验室联合提出LeCo方法，通过自我纠正提高大模型推理准确性，无需人类反馈或外部工具。LeCo利用生成logits测量推理步骤置信度，识别错误步骤。实验结果显示，LeCo在逻辑、常识和数学推理任务中显著提升了性能，同时减少了token消耗和迭代次数，适用于不同模型和方法。
来源：https://mp.weixin.qq.com/s/F8KpJuiDE9DfSVb1ciLUSQ

页: [1]

靠浦ai课堂's Archiver

从正确中学习？大模型的自我纠正新视角