海光信息完成DeepSeek模型与DCU适配

[复制链接]
周大 发表于 2025-2-4 15:21:43 | 显示全部楼层 |阅读模式
海光信息技术团队成功完成DeepSeek V3和R1模型与海光DCU的国产化适配并正式上线,用户可通过“光合开发者社区”或光源官网获取。该模型基于Transformer架构,采用MLA和DeepSeek MoE两大核心技术,分别通过减少KV缓存和智能平衡专家负载来提升推理效率和优化模型性能。DCU作为高性能GPGPU架构AI加速卡,已广泛应用于科教、金融、医疗等多个领域,为行业客户提供自主可控的全精度通用AI加速计算解决方案。
来源:https://tech.ifeng.com/c/8ghMdADVjuU

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 05:43 , Processed in 0.289148 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表