DeepSeek一口气开源3个项目,还有梁文锋亲自参与,昨晚API大降价
DeepSeek 在开源周第四天发布了 DualPipe、EPLB 及训练/推理框架分析数据。DualPipe 实现前向和后向计算-通信阶段的完全重叠,减少流水线气泡;EPLB 解决专家并行中的负载失衡问题,提高 GPU 利用率。此外,DeepSeek 分享了训练和推理框架分析数据,助力社区理解通信-计算重叠策略。同时,该公司推出夜间错峰优惠,API 调用价格降至原价的 25%-50%,受到用户好评。来源:https://mp.weixin.qq.com/s/aeK5eJMwqNuqJaZczKrhgQ
页:
[1]