周大 发表于 2025-8-10 15:13:36

消息称华为即将发布AI推理领域突破性成果:降低对HBM依赖,提升中国大模型性能

华为将于8月12日发布AI推理领域新技术,有望降低对HBM内存的依赖并提升国内大模型推理性能。此前其与北大合作实现DeepSeek高效推理,昇腾平台在多项测试中表现优异,如Atlas 800I服务器单卡吞吐达808 Tokens/s。与科大讯飞合作也使MoE模型推理吞吐提升3.2倍,端到端时延下降50%。
来源:https://tech.ifeng.com/c/8lhQNMLKaJu
页: [1]
查看完整版本: 消息称华为即将发布AI推理领域突破性成果:降低对HBM依赖,提升中国大模型性能