推理模型规划任务成功率从5%到95%,DeepMind遗传算法新研究火了

[复制链接]
周大 发表于 2025-1-23 15:50:44 | 显示全部楼层 |阅读模式
DeepMind推出的“Mind Evolution”进化搜索策略显著提升了大语言模型(LLMs)在规划和推理任务中的表现。该策略结合遗传算法和自然语言处理能力,使Gemini 1.5 Flash任务成功率从5%提升至95.6%,同时使用的tokens数量大幅减少,降低了成本。此外,Mind Evolution无需将任务问题形式化,简化了处理流程。实验结果显示,它在复杂任务中的表现远超其他基线方法,成为当前最先进的解决方案之一。
来源:https://mp.weixin.qq.com/s/QTVSPYyYACv5D74-OGyRnA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-19 11:54 , Processed in 0.362167 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表