周大 发表于 2025-1-26 13:47:40

HuggingFace发起Open R1开源项目

HuggingFace发起Open R1项目,旨在完全复制并开源国产大模型DeepSeek-R1,通过构建R1 pipeline中缺失部分,推动AI开源发展。该项目分为三步,涵盖数据蒸馏、强化学习(RL)pipeline复制及多阶段训练。尽管DeepSeek-R1已开源,Open R1仍获得GitHub上1.9k标星,显示其广泛影响力。DeepSeek-R1的训练流程包含四个阶段,从冷启动到最终强化学习,确保模型性能优化。
来源:https://mp.weixin.qq.com/s/BX2iTak6bPAKdj6Lv1Lt3A
页: [1]
查看完整版本: HuggingFace发起Open R1开源项目