昆仑万维发布Skywork-SWE-32B代码智能体,修复GitHub代码bug准确率达47%

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
昆仑万维推出自主代码智能体基座模型 Skywork-SWE,参数量达 32B,专为复杂软件工程任务设计。该模型基于业内最大规模、可验证的 SWE 数据集训练而成,包含 10,169 个真实代码问题和 8,209 条多轮交互轨迹,每条任务均经过 Docker 环境复现与单元测试验证。Skywork-SWE-32B 在 SWE-bench Verified 基准上取得 47% 准确度,显著超越现有模型,并通过实验揭示了 LLM 软件工程能力的 Scaling Law,验证了数据规模对性能提升的重要性。此外,昆仑万维计划将数据集扩展至更多编程语言,并支持在线强化学习研究。作为行业标杆,Skywork-SWE 标志着高质量任务型数据驱动智能体训练范式的兴起,推动软件工程智能化发展。
来源:https://mp.weixin.qq.com/s/RTLZAir7R-o5fp0CLL-cJA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-24 05:07 , Processed in 0.264201 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表