一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成

[复制链接]
周大 发表于 5 天前 | 显示全部楼层 |阅读模式
SANA-Sprint是一款高效的蒸馏扩散模型,通过结合连续时间一致性蒸馏(sCM)和潜空间对抗蒸馏(LADD),实现了单步生成高质量图像的能力。在H100上,该模型仅需0.1秒即可生成1024x1024分辨率的图像,FID和GenEval分数分别为7.59和0.74。相比传统扩散模型需要50-100次迭代,SANA-Sprint大幅提升了生成效率,同时解决了基于GAN和VSD方法的训练不稳定问题。此外,模型集成了ControlNet,支持实时交互式生成,为创意工具和AIPC应用提供了新可能。
来源:https://mp.weixin.qq.com/s/0wKxhVoDH6JNWecXI2Z-rQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-5 06:16 , Processed in 0.289690 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表