中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花了200万

[复制链接]
周大 发表于 2025-9-18 16:36:40 | 显示全部楼层 |阅读模式
DeepSeek R1登上《Nature》封面,成为首家获此荣誉的中国大模型公司。其660B参数模型训练成本仅约29.4万美元,使用512张H800 GPU完成。论文披露了数学、编程等五大类共15.4万道训练题目,并通过同行评审验证其强化学习方法的有效性。R1在AIME 2024上实现71.0%的pass@1准确率,开源后Hugging Face下载量达1090万次,GitHub Star超91K,谷歌学术引用3596次,安全性评估与GPT-4o相当,标志着中国大模型在科研影响力与透明度方面取得重要突破。
来源:https://mp.weixin.qq.com/s/FlbZ-ZRsEF-4aBwlJttMog

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 13:55 , Processed in 0.275562 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表