腾讯混元升级AI绘画微调范式,在整个扩散轨迹上优化,人工评估分数提升300%
腾讯混元团队提出Direct-Align与SRPO两种新方法,有效提升扩散模型图像生成质量。Direct-Align通过噪声注入实现全轨迹优化,减少“奖励作弊”;SRPO将奖励信号转为文本控制,支持在线灵活调整。实验显示,微调后的FLUX.1-dev模型在10分钟训练后即超越FLUX.1.Krea,人工评估中真实感与美学评分优秀率分别提升至38.9%与40.5%,优于ReFL、DRaFT等方法,生成图像更自然且控制更灵活。来源:https://mp.weixin.qq.com/s/535bmvdYuxiZEQVGzIXNhw
页:
[1]