100行代码打造迷你编程Agent：能修复65%真实项目bug，适配所有大模型

周大发表于 2025-7-28 14:43:50

普林斯顿大学研究团队推出轻量级编程代理mini-SWE-agent，仅需约100行核心代码即可在SWE-bench基准测试中解决65%的问题，性能接近原版但架构更简洁。该代理无需额外插件，兼容主流语言模型，支持本地终端部署，并具备可视化界面、多环境支持和批量推理能力，适合快速部署和实验扩展。团队指出，mini-SWE-agent适用于追求简洁控制流和稳定评估环境的用户，而原版SWE-agent更适合需要高度配置灵活性的场景。该项目延续SWE-bench的开源理念，推动AI在真实软件工程任务中的评估与应用。
来源：https://tech.ifeng.com/c/8lKuyAYvMie

页: [1]

靠浦ai课堂's Archiver

100行代码打造迷你编程Agent：能修复65%真实项目bug，适配所有大模型