NeurIPS 2025 Oral | 1个Token零成本,REG让Diffusion训练收敛快20倍!

[复制链接]
周大 发表于 前天 15:12 | 显示全部楼层 |阅读模式
REG 提出将预训练模型的 class token 与 latent 联合加噪训练,在不增加显著推理成本下大幅加速扩散 Transformer 收敛。在 ImageNet 256×256 上较 SiT 和 REPA 加速达 63 倍与 23 倍,400K 步即超越 4M 步基线,FID 最低至 1.36,且在 512×512 分辨率也表现优异,训练效率提升超 95%,验证了语义纠缠对生成模型训练的有效性。
来源:https://mp.weixin.qq.com/s/OOLyVz6agajec2_DmX0uKg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-12-1 06:08 , Processed in 0.269751 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表