周大 发表于 2025-3-31 13:56:39

一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成

SANA-Sprint是一款高效的蒸馏扩散模型,通过结合连续时间一致性蒸馏(sCM)和潜空间对抗蒸馏(LADD),实现了单步生成高质量图像的能力。在H100上,该模型仅需0.1秒即可生成1024x1024分辨率的图像,FID和GenEval分数分别为7.59和0.74。相比传统扩散模型需要50-100次迭代,SANA-Sprint大幅提升了生成效率,同时解决了基于GAN和VSD方法的训练不稳定问题。此外,模型集成了ControlNet,支持实时交互式生成,为创意工具和AIPC应用提供了新可能。
来源:https://mp.weixin.qq.com/s/0wKxhVoDH6JNWecXI2Z-rQ
页: [1]
查看完整版本: 一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成