一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成
SANA-Sprint是一款高效的蒸馏扩散模型,通过结合连续时间一致性蒸馏(sCM)和潜空间对抗蒸馏(LADD),实现了单步生成高质量图像的能力。在H100上,该模型仅需0.1秒即可生成1024x1024分辨率的图像,FID和GenEval分数分别为7.59和0.74。相比传统扩散模型需要50-100次迭代,SANA-Sprint大幅提升了生成效率,同时解决了基于GAN和VSD方法的训练不稳定问题。此外,模型集成了ControlNet,支持实时交互式生成,为创意工具和AIPC应用提供了新可能。来源:https://mp.weixin.qq.com/s/0wKxhVoDH6JNWecXI2Z-rQ
页:
[1]