周大 发表于 2025-8-19 14:42:44

中科院清华团队推出SE-Agent自进化框架,Claude-4代码修复成功率突破80%创纪录

中科院、清华大学与阶跃星辰联合提出SE-Agent,一种基于大语言模型的自进化推理框架。该框架通过修订、重组与精炼三大机制,实现解题轨迹的协同进化,显著提升多步推理能力。在SWE-Bench Verified测试中,SE-Agent使Claude-3.7-Sonnet的首次尝试成功率提升20.6%,达61.2%,刷新开源框架纪录。在多个LLM上均实现显著性能提升,如Qwen-2.5-72B提升106%、Llama-3.1-70B提升112%。其核心突破在于轨迹级多样性生成与跨轨迹协同优化,突破传统方法的局部最优限制。研究团队计划将该框架扩展至更广泛的智能系统领域。
来源:https://mp.weixin.qq.com/s/hbvRxR3M95d2XlEb7drHgQ
页: [1]
查看完整版本: 中科院清华团队推出SE-Agent自进化框架,Claude-4代码修复成功率突破80%创纪录