CodeDPO：提升代码生成准确性和效率的新框架

周大发表于 2024-11-27 14:48:06

北京大学李戈教授团队与字节跳动合作，提出CodeDPO框架，通过偏好学习和自验证机制，显著提升代码生成的准确性和执行效率。相比SFT方法，CodeDPO在多个模型上将HumanEval得分提升10个百分点，最高增幅接近1/3。实验结果表明，CodeDPO在HumanEval、MBPP和DS-1000等多个数据集上均带来显著性能提升，特别是在代码执行效率方面，生成的代码平均加速1.25至1.45倍。
来源：https://mp.weixin.qq.com/s/WH7EE1uPMzcKO6w8m0zBdg

页: [1]

靠浦ai课堂's Archiver

CodeDPO：提升代码生成准确性和效率的新框架