Dualformer结合快慢思考,大幅提高复杂任务性能

[复制链接]
周大 发表于 2024-10-17 14:08:28 | 显示全部楼层 |阅读模式
田渊栋团队开发的Dualformer模型结合快慢思考模式,显著提高了复杂任务的性能并降低了成本。在迷宫和推箱子任务中,Dualformer的最优解率高达97.6%,推理步骤减少45.5%。自动切换模式下,最优解率为96.6%,推理步骤减少59.9%。该模型基于Searchformer,通过定制丢弃策略优化训练过程,实现更简洁有效的搜索和推理。
来源:https://mp.weixin.qq.com/s/_ZgDjxdhj6uUyN72LC8chA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 00:08 , Processed in 0.283225 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表