HuggingFace发起Open R1开源项目

[复制链接]
周大 发表于 2025-1-26 13:47:40 | 显示全部楼层 |阅读模式
HuggingFace发起Open R1项目,旨在完全复制并开源国产大模型DeepSeek-R1,通过构建R1 pipeline中缺失部分,推动AI开源发展。该项目分为三步,涵盖数据蒸馏、强化学习(RL)pipeline复制及多阶段训练。尽管DeepSeek-R1已开源,Open R1仍获得GitHub上1.9k标星,显示其广泛影响力。DeepSeek-R1的训练流程包含四个阶段,从冷启动到最终强化学习,确保模型性能优化。
来源:https://mp.weixin.qq.com/s/BX2iTak6bPAKdj6Lv1Lt3A

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 10:39 , Processed in 0.266595 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表