周大 发表于 2025-5-23 15:19:47

以加代乘?华为数学家出手,昇腾算子的高能设计与优化,性能提升30%!

随着大语言模型参数规模快速增长,推理成本高昂成为行业痛点。华为团队发布三项关键技术,包括以加代乘的AMLA算子、融合算子优化以及SMTurbo内存加速技术,显著提升昇腾芯片在大模型推理中的速度与能效。其中,AMLA算力利用率突破71%,SMTurbo实现384卡跨节点超低延迟通信。这些技术不仅优化了昇腾生态,还为行业提供参考范本,助力大模型推理迈向更高效阶段。
来源:https://mp.weixin.qq.com/s/qYV0ptrGn6xL8nWO--L-eA
页: [1]
查看完整版本: 以加代乘?华为数学家出手,昇腾算子的高能设计与优化,性能提升30%!