突破单链思考上限,清华团队提出原生「并行思考」scale范式

[复制链接]
周大 发表于 2025-9-17 13:50:42 | 显示全部楼层 |阅读模式
清华大学 AIR 提出新型并行推理框架 ParaThinker,通过让大语言模型在单次推理中生成并整合多条独立路径,突破当前“深度思考”策略下的“隧道视野”瓶颈。实验显示,在多个数学推理基准上,ParaThinker 显著提升模型准确率,1.5B 模型提升 12.3%,7B 模型提升 7.5%,且延迟增长有限。研究指出,“广度扩展”比“深度扩展”更高效,为未来模型推理策略提供新方向。
来源:https://mp.weixin.qq.com/s/jkDVYxiuplNrFfZYKLjkxg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 14:28 , Processed in 0.282193 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表