消息称华为即将发布AI推理领域突破性成果:降低对HBM依赖,提升中国大模型性能

[复制链接]
周大 发表于 2025-8-10 15:13:36 | 显示全部楼层 |阅读模式
华为将于8月12日发布AI推理领域新技术,有望降低对HBM内存的依赖并提升国内大模型推理性能。此前其与北大合作实现DeepSeek高效推理,昇腾平台在多项测试中表现优异,如Atlas 800I服务器单卡吞吐达808 Tokens/s。与科大讯飞合作也使MoE模型推理吞吐提升3.2倍,端到端时延下降50%。
来源:https://tech.ifeng.com/c/8lhQNMLKaJu

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-22 11:10 , Processed in 0.291455 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表