DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

[复制链接]
周大 发表于 2025-2-27 15:46:13 | 显示全部楼层 |阅读模式
斯坦福和普林斯顿的研究表明,DeepSeek-R1在生成自定义CUDA内核方面表现优异,超过o1和Claude 3.5 Sonnet,但在不到20%的任务上超越PyTorch Eager基线。研究团队提出的KernelBench框架评估了语言模型生成GPU内核的能力,涵盖250个任务。尽管生成正确内核面临挑战,但通过迭代优化和反馈机制,模型展示了显著的改进潜力。提供硬件信息和上下文示例有助于提升模型性能,未来KernelBench将扩展至更多AI任务并持续演进。
来源:https://mp.weixin.qq.com/s/9PA8m7lKaJlZabN246lT_Q

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 07:56 , Processed in 0.299506 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表