动态压缩CoT推理新方法LightThinker来了

[复制链接]
周大 发表于 2025-8-28 14:40:12 | 显示全部楼层 |阅读模式
随着大语言模型在复杂推理任务中的广泛应用,其高资源消耗问题日益突出。浙江大学与蚂蚁集团等机构提出 LightThinker,通过动态压缩中间推理步骤为摘要信息,显著减少上下文长度。实验显示,该方法在 Qwen 模型上将峰值内存使用减少 70%,推理时间缩短 26%,并在 Llama 上保持准确性的同时提升效率。尽管在数学任务中存在信息丢失风险,LightThinker 仍为高效推理提供了新思路。
来源:https://mp.weixin.qq.com/s/LLCQE2keVFwx0280p1RxOg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 18:38 , Processed in 0.303687 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表