北大、字节跳动联手发布SWE-Swiss:一把修复代码Bug的「瑞士军刀」,完整配方直指开源SOTA

[复制链接]
周大 发表于 2025-8-8 14:31:30 | 显示全部楼层 |阅读模式
由北京大学、字节跳动 Seed 团队与香港大学联合研发的 SWE-Swiss 方法,成功训练出 32B 参数模型 SWE-Swiss-32B,在软件工程基准 SWE-bench Verified 上取得 60.2% 的准确率,达到同尺寸模型的 SOTA,并与更大模型性能相当。该方法将软件工程任务拆解为代码定位、修复和单元测试生成三部分,并采用高质量数据集与两阶段训练流程:SFT 阶段达到 36.0%,RL 阶段提升至 45.0%,最终通过“增强自我一致性”策略将性能提升至 60.2%。研究团队表示将开源模型与数据,推动相关领域发展。
来源:https://mp.weixin.qq.com/s/3wBQR9tD0IfooaCgXN12Sw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-22 10:52 , Processed in 0.255918 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表