靠浦ai课堂's Archiver
版块
›
靠浦ai资讯
› 从正确中学习?大模型的自我纠正新视角
周大
发表于 2024-9-17 16:18:54
从正确中学习?大模型的自我纠正新视角
香港城市大学与华为诺亚方舟实验室联合提出LeCo方法,通过自我纠正提高大模型推理准确性,无需人类反馈或外部工具。LeCo利用生成logits测量推理步骤置信度,识别错误步骤。实验结果显示,LeCo在逻辑、常识和数学推理任务中显著提升了性能,同时减少了token消耗和迭代次数,适用于不同模型和方法。
来源:https://mp.weixin.qq.com/s/F8KpJuiDE9DfSVb1ciLUSQ
页:
[1]
查看完整版本:
从正确中学习?大模型的自我纠正新视角