周大 发表于 2024-9-17 16:18:54

从正确中学习?大模型的自我纠正新视角

香港城市大学与华为诺亚方舟实验室联合提出LeCo方法,通过自我纠正提高大模型推理准确性,无需人类反馈或外部工具。LeCo利用生成logits测量推理步骤置信度,识别错误步骤。实验结果显示,LeCo在逻辑、常识和数学推理任务中显著提升了性能,同时减少了token消耗和迭代次数,适用于不同模型和方法。
来源:https://mp.weixin.qq.com/s/F8KpJuiDE9DfSVb1ciLUSQ
页: [1]
查看完整版本: 从正确中学习?大模型的自我纠正新视角