告别CUDA无需Triton!Mirage零门槛生成PyTorch算子,人均GPU编程大师?
CMU团队发布Mirage,一款PyTorch算子编译器,无需CUDA/Triton代码即可生成高效GPU内核,提升生产力和性能。Mirage在LLM/GenAI基准测试中表现出色,性能提升1.2至2.5倍,并自动验证内核正确性。该工具旨在简化GPU编程,降低AI开发者门槛。来源:https://mp.weixin.qq.com/s/M3WFt17QErAt46VuqkFjFQ
页:
[1]