华为昇腾推理加速1.6倍，Pangu Light破解LLM剪枝降智难题

周大发表于 2025-5-27 15:42:48

针对大语言模型参数规模过大导致的高成本和低效率问题，华为诺亚方舟实验室推出Pangu Light框架，通过跨层注意力剪枝（CLAP）、稳定化LayerNorm剪枝（SLNP）等技术，解决了激进剪枝导致模型性能下降的问题。实验显示，Pangu Light在昇腾NPU上实现了高效压缩与加速，同时保持98.9%的原始模型推理能力，优于同类方案。这一成果不仅提升了大模型的应用效率，还展现了算法创新与国产AI计算平台深度融合的潜力。
来源：https://mp.weixin.qq.com/s/u6W4Fmv1r836iR53uA00oA

页: [1]

靠浦ai课堂's Archiver

华为昇腾推理加速1.6倍，Pangu Light破解LLM剪枝降智难题