英伟达联手MIT清北发布SANA 1.5!线性扩散Transformer再刷文生图新SOTA

[复制链接]
周大 发表于 2025-2-7 15:10:57 | 显示全部楼层 |阅读模式
SANA 1.5是由英伟达联合MIT、清华、北大等机构研发的一种高效可扩展线性扩散Transformer,专门用于文本生成图像任务。该模型通过三项创新——高效的模型增长策略、模型深度剪枝技术和推理时扩展策略,大幅降低了训练和推理成本,同时提升了生成质量。实验结果显示,SANA 1.5的训练收敛速度比传统方法快2.5倍,GenEval分数从0.72提升至0.80,在基准测试中达到了最先进水平。此外,SANA 1.5在运行速度上表现出色,其延迟比FLUX-dev低5.5倍,吞吐量为FLUX-dev的6.5倍,使其在实际应用中更具优势。
来源:https://mp.weixin.qq.com/s/UvOoDGvzAFjA3ImXXVlktw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 02:54 , Processed in 0.297980 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表