100行代码打造迷你编程Agent:能修复65%真实项目bug,适配所有大模型
普林斯顿大学研究团队推出轻量级编程代理mini-SWE-agent,仅需约100行核心代码即可在SWE-bench基准测试中解决65%的问题,性能接近原版但架构更简洁。该代理无需额外插件,兼容主流语言模型,支持本地终端部署,并具备可视化界面、多环境支持和批量推理能力,适合快速部署和实验扩展。团队指出,mini-SWE-agent适用于追求简洁控制流和稳定评估环境的用户,而原版SWE-agent更适合需要高度配置灵活性的场景。该项目延续SWE-bench的开源理念,推动AI在真实软件工程任务中的评估与应用。来源:https://tech.ifeng.com/c/8lKuyAYvMie
页:
[1]