DeepSeek今日连开3源!针对优化的并行策略,梁文锋本人参与开发

[复制链接]
周大 发表于 2025-2-27 15:48:27 | 显示全部楼层 |阅读模式
DeepSeek在开源周第四天发布了三项优化并行策略的技术。DualPipe作为双向流水线并行算法,能完全重叠前向和后向计算-通信阶段,减少“流水线气泡”,提高硬件利用率;EPLB通过复制高负载专家并智能分配到不同GPU上,解决MoE模型负载不平衡问题;Profiling Data提供性能分析数据以展示前两者的实际应用效果。这些技术发布后迅速获得关注。
来源:https://mp.weixin.qq.com/s/GXIvj1omweDu3_DZjo6sVg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 07:50 , Processed in 0.342416 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表