中科院清华团队推出SE-Agent自进化框架，Claude-4代码修复成功率突破80%创纪录

周大发表于 2025-8-19 14:42:44

中科院、清华大学与阶跃星辰联合提出SE-Agent，一种基于大语言模型的自进化推理框架。该框架通过修订、重组与精炼三大机制，实现解题轨迹的协同进化，显著提升多步推理能力。在SWE-Bench Verified测试中，SE-Agent使Claude-3.7-Sonnet的首次尝试成功率提升20.6%，达61.2%，刷新开源框架纪录。在多个LLM上均实现显著性能提升，如Qwen-2.5-72B提升106%、Llama-3.1-70B提升112%。其核心突破在于轨迹级多样性生成与跨轨迹协同优化，突破传统方法的局部最优限制。研究团队计划将该框架扩展至更广泛的智能系统领域。
来源：https://mp.weixin.qq.com/s/hbvRxR3M95d2XlEb7drHgQ

		自动登录	找回密码
密码			立即注册

课程导航

中科院清华团队推出SE-Agent自进化框架，Claude-4代码修复成功率突破80%创纪录