DeepSeek-v3震撼发布:年轻团队创新突破

[复制链接]
周大 发表于 2025-1-4 15:37:34 | 显示全部楼层 |阅读模式
DeepSeek以其最新发布的DeepSeek-v3大模型震撼AI圈,该模型仅用Llama 3的1/11算力便实现了更优性能。团队以年轻人为主,成员多来自顶尖高校,其中不乏应届生和在读生。DeepSeek-V2提出的MLA新型注意力机制和GRPO算法大幅减少了计算量和资源需求。公司重视软硬件协同设计,通过优化硬件降低了训练成本。创始人梁文锋表示招人注重能力而非经验,团队结构与OpenAI相似,新人可调动资源开展项目并取得显著成果。
来源:https://tech.ifeng.com/c/8frpMUaMPJU

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-22 03:34 , Processed in 0.311384 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表