DeepSeek突然拥抱国产GPU语言!TileLang对标CUDA替代Triton,华为昇腾Day0官宣支持适配

[复制链接]
周大 发表于 2025-9-30 14:17:36 | 显示全部楼层 |阅读模式
DeepSeek v3.2虽未在论文中提及,但其在官方公告中披露采用北大团队开发的领域专用语言TileLang编写算子,引发高度关注。该语言基于TVM,采用Python语法,能将FlashAttention实现从500+行代码压缩至80行,且性能媲美现有方案,在H100上解码速度与FlashMLA相当,部分实现提速达30%。TileLang自2025年1月开源以来已获1.9k GitHub标星,支持华为昇腾、沐曦等国产GPU,展现出良好的生态适配性,标志着国产底层工具链在AI核心计算领域的逐步崛起。
来源:https://mp.weixin.qq.com/s/0XLksANQvSMRgF4SYX7Kxw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-10-10 00:03 , Processed in 0.273834 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表