周大 发表于 2025-2-4 15:21:43

海光信息完成DeepSeek模型与DCU适配

海光信息技术团队成功完成DeepSeek V3和R1模型与海光DCU的国产化适配并正式上线,用户可通过“光合开发者社区”或光源官网获取。该模型基于Transformer架构,采用MLA和DeepSeek MoE两大核心技术,分别通过减少KV缓存和智能平衡专家负载来提升推理效率和优化模型性能。DCU作为高性能GPGPU架构AI加速卡,已广泛应用于科教、金融、医疗等多个领域,为行业客户提供自主可控的全精度通用AI加速计算解决方案。
来源:https://tech.ifeng.com/c/8ghMdADVjuU
页: [1]
查看完整版本: 海光信息完成DeepSeek模型与DCU适配