周大 发表于 2025-1-26 13:53:31

DeepSeek低成本复现引发全球关注

近期,UC伯克利、港科大及HuggingFace等机构成功以低成本(约30美元)复现DeepSeek模型,仅需强化学习而无需监督微调。这一成果不仅展示了技术突破,还引发了关于全球AI中心是否将向中国转移的讨论。特别是DeepSeek在数学推理方面的优异表现,如港科大团队仅用8K样本就在7B模型上获得理想结果。此外,HuggingFace已宣布将完全开源复刻DeepSeek R1所有pipeline。目前,DeepSeek R1已成为从斯坦福到MIT的研究人员首选模型,在应用商店效率类榜单中名列前茅,标志着AI领域或将进入新的分水岭。
来源:https://mp.weixin.qq.com/s/o41vPh9eJCVjCRUE4u5npA
页: [1]
查看完整版本: DeepSeek低成本复现引发全球关注