周大 发表于 2024-10-17 14:08:28

Dualformer结合快慢思考,大幅提高复杂任务性能

田渊栋团队开发的Dualformer模型结合快慢思考模式,显著提高了复杂任务的性能并降低了成本。在迷宫和推箱子任务中,Dualformer的最优解率高达97.6%,推理步骤减少45.5%。自动切换模式下,最优解率为96.6%,推理步骤减少59.9%。该模型基于Searchformer,通过定制丢弃策略优化训练过程,实现更简洁有效的搜索和推理。
来源:https://mp.weixin.qq.com/s/_ZgDjxdhj6uUyN72LC8chA
页: [1]
查看完整版本: Dualformer结合快慢思考,大幅提高复杂任务性能