CodeDPO:提升代码生成准确性和效率的新框架

[复制链接]
周大 发表于 2024-11-27 14:48:06 | 显示全部楼层 |阅读模式
北京大学李戈教授团队与字节跳动合作,提出CodeDPO框架,通过偏好学习和自验证机制,显著提升代码生成的准确性和执行效率。相比SFT方法,CodeDPO在多个模型上将HumanEval得分提升10个百分点,最高增幅接近1/3。实验结果表明,CodeDPO在HumanEval、MBPP和DS-1000等多个数据集上均带来显著性能提升,特别是在代码执行效率方面,生成的代码平均加速1.25至1.45倍。
来源:https://mp.weixin.qq.com/s/WH7EE1uPMzcKO6w8m0zBdg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-25 09:35 , Processed in 0.285862 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表