DeepSeek-R1自写CUDA内核跑分屠榜！斯坦福学霸狂飙GPU编程自动化挑战人类

周大发表于 2025-2-27 15:46:13

斯坦福和普林斯顿的研究表明，DeepSeek-R1在生成自定义CUDA内核方面表现优异，超过o1和Claude 3.5 Sonnet，但在不到20%的任务上超越PyTorch Eager基线。研究团队提出的KernelBench框架评估了语言模型生成GPU内核的能力，涵盖250个任务。尽管生成正确内核面临挑战，但通过迭代优化和反馈机制，模型展示了显著的改进潜力。提供硬件信息和上下文示例有助于提升模型性能，未来KernelBench将扩展至更多AI任务并持续演进。
来源：https://mp.weixin.qq.com/s/9PA8m7lKaJlZabN246lT_Q

页: [1]

靠浦ai课堂's Archiver

DeepSeek-R1自写CUDA内核跑分屠榜！斯坦福学霸狂飙GPU编程自动化挑战人类