周大 发表于 2025-8-8 14:31:30

北大、字节跳动联手发布SWE-Swiss:一把修复代码Bug的「瑞士军刀」,完整配方直指开源SOTA

由北京大学、字节跳动 Seed 团队与香港大学联合研发的 SWE-Swiss 方法,成功训练出 32B 参数模型 SWE-Swiss-32B,在软件工程基准 SWE-bench Verified 上取得 60.2% 的准确率,达到同尺寸模型的 SOTA,并与更大模型性能相当。该方法将软件工程任务拆解为代码定位、修复和单元测试生成三部分,并采用高质量数据集与两阶段训练流程:SFT 阶段达到 36.0%,RL 阶段提升至 45.0%,最终通过“增强自我一致性”策略将性能提升至 60.2%。研究团队表示将开源模型与数据,推动相关领域发展。
来源:https://mp.weixin.qq.com/s/3wBQR9tD0IfooaCgXN12Sw
页: [1]
查看完整版本: 北大、字节跳动联手发布SWE-Swiss:一把修复代码Bug的「瑞士军刀」,完整配方直指开源SOTA