周大 发表于 2025-2-27 15:46:13

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

斯坦福和普林斯顿的研究表明,DeepSeek-R1在生成自定义CUDA内核方面表现优异,超过o1和Claude 3.5 Sonnet,但在不到20%的任务上超越PyTorch Eager基线。研究团队提出的KernelBench框架评估了语言模型生成GPU内核的能力,涵盖250个任务。尽管生成正确内核面临挑战,但通过迭代优化和反馈机制,模型展示了显著的改进潜力。提供硬件信息和上下文示例有助于提升模型性能,未来KernelBench将扩展至更多AI任务并持续演进。
来源:https://mp.weixin.qq.com/s/9PA8m7lKaJlZabN246lT_Q
页: [1]
查看完整版本: DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类