媲美OpenAI-o3,刚刚开源模型DeepCoder,训练方法、数据集大公开
Together AI与Agentica联合开源了140亿参数的新模型DeepCoder-14B-Preview,在LiveCodeBench测试中表现优异,评分60.6%,超越OpenAI的o1(59.5%)。该模型基于Deepseek-R1-Distilled-Qwen-14B并通过强化学习优化,训练数据集包含24K个高质量编程问题。项目不仅开源模型权重,还公开了训练数据、方法及优化细节。此外,DeepCoder引入迭代上下文扩展技术和verl-pipeline,大幅提升训练效率和上下文处理能力。Together AI近期完成3.05亿美元融资,估值达33亿美元。来源:https://tech.ifeng.com/c/8iNmZGBD4Tz
页:
[1]