周大 发表于 2025-2-24 15:18:04

DeepSeek发布FlashMLA及多项AI创新

DeepSeek在开源周首日发布针对英伟达Hopper GPU优化的FlashMLA解码内核,在H800 SXM5平台上实现3000GB/s带宽和580 TFLOPS算力。其核心技术MLA将KV缓存减少93.3%,显著降低训练成本。V3版本引入多Token预测、混合专家模型(MoE)等创新,结合强化学习提升模型性能与安全性。这些技术突破有助于加速AI模型开发进程,推动人工智能领域发展。
来源:https://mp.weixin.qq.com/s/IIRtU2gFCeCnrhtamGVOig
页: [1]
查看完整版本: DeepSeek发布FlashMLA及多项AI创新