苹果发布DiffuCode-7B-cpGRPO编程AI模型:基于Qwen2.5-7B,可不按顺序生成代码
苹果公司近日在 Hugging Face 上开源了一款名为 DiffuCode-7B-cpGRPO 的 AI 编程模型,该模型基于扩散机制,能够在不依赖传统从左到右顺序的前提下生成代码。其技术源自论文《DiffuCoder》,通过提高采样温度使生成过程更具灵活性。苹果基于阿里开源模型 Qwen2.5-7B 进行重构,并用超 20000 个示例训练优化。在主流测试中,其性能相较其他扩散模型提升 4.4%,展现出在代码生成领域的潜力。来源:https://tech.ifeng.com/c/8kjcpymfNdi
页:
[1]