周大 发表于 2025-9-15 14:56:13

腾讯混元升级AI绘画微调范式,在整个扩散轨迹上优化,人工评估分数提升300%

腾讯混元团队提出Direct-Align与SRPO两种新方法,有效提升扩散模型图像生成质量。Direct-Align通过噪声注入实现全轨迹优化,减少“奖励作弊”;SRPO将奖励信号转为文本控制,支持在线灵活调整。实验显示,微调后的FLUX.1-dev模型在10分钟训练后即超越FLUX.1.Krea,人工评估中真实感与美学评分优秀率分别提升至38.9%与40.5%,优于ReFL、DRaFT等方法,生成图像更自然且控制更灵活。
来源:https://mp.weixin.qq.com/s/535bmvdYuxiZEQVGzIXNhw
页: [1]
查看完整版本: 腾讯混元升级AI绘画微调范式,在整个扩散轨迹上优化,人工评估分数提升300%