推理模型规划任务成功率从5%到95%,DeepMind遗传算法新研究火了
DeepMind推出的“Mind Evolution”进化搜索策略显著提升了大语言模型(LLMs)在规划和推理任务中的表现。该策略结合遗传算法和自然语言处理能力,使Gemini 1.5 Flash任务成功率从5%提升至95.6%,同时使用的tokens数量大幅减少,降低了成本。此外,Mind Evolution无需将任务问题形式化,简化了处理流程。实验结果显示,它在复杂任务中的表现远超其他基线方法,成为当前最先进的解决方案之一。来源:https://mp.weixin.qq.com/s/QTVSPYyYACv5D74-OGyRnA
页:
[1]