媲美OpenAI-o3,刚刚开源模型DeepCoder,训练方法、数据集大公开

[复制链接]
周大 发表于 2025-4-9 14:05:53 | 显示全部楼层 |阅读模式
Together AI与Agentica联合开源了140亿参数的新模型DeepCoder-14B-Preview,在LiveCodeBench测试中表现优异,评分60.6%,超越OpenAI的o1(59.5%)。该模型基于Deepseek-R1-Distilled-Qwen-14B并通过强化学习优化,训练数据集包含24K个高质量编程问题。项目不仅开源模型权重,还公开了训练数据、方法及优化细节。此外,DeepCoder引入迭代上下文扩展技术和verl-pipeline,大幅提升训练效率和上下文处理能力。Together AI近期完成3.05亿美元融资,估值达33亿美元。
来源:https://tech.ifeng.com/c/8iNmZGBD4Tz

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 20:37 , Processed in 0.283425 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表