周大 发表于 2025-8-20 15:30:38

思维链可无限延伸了,MIT等打破大模型上下文天花板

MIT联合团队提出新型推理架构TIM及配套引擎TIMRUN,通过递归子任务树与动态剪枝机制,突破大模型上下文窗口限制,实现长程推理。该架构将推理过程结构化,减少KV缓存使用最多达64.1%,并在MATH500和AIME 2024数学任务中分别取得69%和46.7%的准确率。在多跳推理和工具调用任务中,TIM表现优于现有方法,且效率更高。TIMRUN通过动态内存管理和自动工具调用,显著提升吞吐量稳定性,为复杂推理任务提供新思路。
来源:https://mp.weixin.qq.com/s/cgbJ1GsPVHELEyK2RlmnbA
页: [1]
查看完整版本: 思维链可无限延伸了,MIT等打破大模型上下文天花板