搞不懂CUDA的人有救了,Devin开发商开源Kevin,强化学习生成CUDA内核
Cognition AI 推出强化学习生成 CUDA 内核的开源模型 Kevin-32B,基于 QwQ-32B 经过多轮训练,在 KernelBench 数据集上实现平均正确率 65% 和 1.41 倍加速比,优于前沿模型。其在二级任务中表现尤为突出,正确率与加速比分别达 48% 和 1.74 倍。研究解决了上下文爆炸和样本效率低下问题,并探讨了奖励塑造与并行轨迹优化,为编程智能体训练提供了新思路。来源:https://mp.weixin.qq.com/s/iljKHFj_1ufwp6CDc8tUGw
页:
[1]