中科院清华团队推出SE-Agent自进化框架,Claude-4代码修复成功率突破80%创纪录

[复制链接]
周大 发表于 3 天前 | 显示全部楼层 |阅读模式
中科院、清华大学与阶跃星辰联合提出SE-Agent,一种基于大语言模型的自进化推理框架。该框架通过修订、重组与精炼三大机制,实现解题轨迹的协同进化,显著提升多步推理能力。在SWE-Bench Verified测试中,SE-Agent使Claude-3.7-Sonnet的首次尝试成功率提升20.6%,达61.2%,刷新开源框架纪录。在多个LLM上均实现显著性能提升,如Qwen-2.5-72B提升106%、Llama-3.1-70B提升112%。其核心突破在于轨迹级多样性生成与跨轨迹协同优化,突破传统方法的局部最优限制。研究团队计划将该框架扩展至更广泛的智能系统领域。
来源:https://mp.weixin.qq.com/s/hbvRxR3M95d2XlEb7drHgQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-22 06:20 , Processed in 0.291543 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表