推理token减少46%!Meta新方法缩短思维链,告别重复推导

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
Meta与多家机构联合提出元认知复用机制,通过让模型提炼并复用推理“行为”以减少重复计算。该方法在MATH、AIME等数学任务中,最高减少46%推理token消耗,同时保持准确率;在自我改进场景中准确率提升达10%。通过行为条件推理、自我修正和监督微调三种方式,显著提升了大模型推理效率与能力转化效果,为降低推理成本提供了新路径。
来源:https://mp.weixin.qq.com/s/NIj6lKcjCV5kKwPVCEaxfg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-10-9 23:55 , Processed in 0.289960 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表