周大 发表于 2024-11-13 13:24:06

加速国产GPU开发!摩尔线程开源高性能计算库MUTLASS

摩尔线程宣布正式开源高性能线性代数模板库MUTLASS,专为自研MUSA架构优化,支持多种数据精度,提供高性能C++模板组件,加速矩阵乘法及相关变种的开发。此次开源增加了第三代MUSA架构的MMA计算原语,支持TF32/FP16/BF16/INT8等数据精度,助力开发者低成本实现定制化高性能算子,推动算法创新。此前,摩尔线程已开源多个项目,包括OpenCV-MUSA、MooER和vLLM-MUSA。
来源:https://tech.ifeng.com/c/8eSHMJeT2Yv
页: [1]
查看完整版本: 加速国产GPU开发!摩尔线程开源高性能计算库MUTLASS