DeepSeek发布FlashMLA及多项AI创新
DeepSeek在开源周首日发布针对英伟达Hopper GPU优化的FlashMLA解码内核,在H800 SXM5平台上实现3000GB/s带宽和580 TFLOPS算力。其核心技术MLA将KV缓存减少93.3%,显著降低训练成本。V3版本引入多Token预测、混合专家模型(MoE)等创新,结合强化学习提升模型性能与安全性。这些技术突破有助于加速AI模型开发进程,推动人工智能领域发展。来源:https://mp.weixin.qq.com/s/IIRtU2gFCeCnrhtamGVOig
页:
[1]