腾讯混元升级AI绘画微调范式，在整个扩散轨迹上优化，人工评估分数提升300%

周大发表于 2025-9-15 14:56:13

腾讯混元团队提出Direct-Align与SRPO两种新方法，有效提升扩散模型图像生成质量。Direct-Align通过噪声注入实现全轨迹优化，减少“奖励作弊”；SRPO将奖励信号转为文本控制，支持在线灵活调整。实验显示，微调后的FLUX.1-dev模型在10分钟训练后即超越FLUX.1.Krea，人工评估中真实感与美学评分优秀率分别提升至38.9%与40.5%，优于ReFL、DRaFT等方法，生成图像更自然且控制更灵活。
来源：https://mp.weixin.qq.com/s/535bmvdYuxiZEQVGzIXNhw

页: [1]

靠浦ai课堂's Archiver

腾讯混元升级AI绘画微调范式，在整个扩散轨迹上优化，人工评估分数提升300%