思维链可无限延伸了,MIT等打破大模型上下文天花板

[复制链接]
周大 发表于 2025-8-20 15:30:38 | 显示全部楼层 |阅读模式
MIT联合团队提出新型推理架构TIM及配套引擎TIMRUN,通过递归子任务树与动态剪枝机制,突破大模型上下文窗口限制,实现长程推理。该架构将推理过程结构化,减少KV缓存使用最多达64.1%,并在MATH500和AIME 2024数学任务中分别取得69%和46.7%的准确率。在多跳推理和工具调用任务中,TIM表现优于现有方法,且效率更高。TIMRUN通过动态内存管理和自动工具调用,显著提升吞吐量稳定性,为复杂推理任务提供新思路。
来源:https://mp.weixin.qq.com/s/cgbJ1GsPVHELEyK2RlmnbA

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 21:03 , Processed in 0.291821 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表