DeepSeek发布FlashMLA及多项AI创新

周大发表于 2025-2-24 15:18:04

DeepSeek在开源周首日发布针对英伟达Hopper GPU优化的FlashMLA解码内核，在H800 SXM5平台上实现3000GB/s带宽和580 TFLOPS算力。其核心技术MLA将KV缓存减少93.3%，显著降低训练成本。V3版本引入多Token预测、混合专家模型(MoE)等创新，结合强化学习提升模型性能与安全性。这些技术突破有助于加速AI模型开发进程，推动人工智能领域发展。
来源：https://mp.weixin.qq.com/s/IIRtU2gFCeCnrhtamGVOig

页: [1]

靠浦ai课堂's Archiver

DeepSeek发布FlashMLA及多项AI创新