DeepSeek发布FlashMLA及多项AI创新

[复制链接]
周大 发表于 2025-2-24 15:18:04 | 显示全部楼层 |阅读模式
DeepSeek在开源周首日发布针对英伟达Hopper GPU优化的FlashMLA解码内核,在H800 SXM5平台上实现3000GB/s带宽和580 TFLOPS算力。其核心技术MLA将KV缓存减少93.3%,显著降低训练成本。V3版本引入多Token预测、混合专家模型(MoE)等创新,结合强化学习提升模型性能与安全性。这些技术突破有助于加速AI模型开发进程,推动人工智能领域发展。
来源:https://mp.weixin.qq.com/s/IIRtU2gFCeCnrhtamGVOig

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 11:41 , Processed in 0.275481 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表