加速国产GPU开发!摩尔线程开源高性能计算库MUTLASS
摩尔线程宣布正式开源高性能线性代数模板库MUTLASS,专为自研MUSA架构优化,支持多种数据精度,提供高性能C++模板组件,加速矩阵乘法及相关变种的开发。此次开源增加了第三代MUSA架构的MMA计算原语,支持TF32/FP16/BF16/INT8等数据精度,助力开发者低成本实现定制化高性能算子,推动算法创新。此前,摩尔线程已开源多个项目,包括OpenCV-MUSA、MooER和vLLM-MUSA。来源:https://tech.ifeng.com/c/8eSHMJeT2Yv
页:
[1]