SnapGen:移动端高效文生图模型

[复制链接]
周大 发表于 2024-12-25 15:29:55 | 显示全部楼层 |阅读模式
Snap研究院Creative Vision团队推出专为移动设备设计的文生图模型SnapGen。该模型仅有379M参数,在iPhone 16 Pro-Max上1.4秒即可生成1024x1024图片。研究团队通过优化UNet架构和图像解码器、采用多级知识蒸馏等技术实现高效训练。实验表明,SnapGen在多项基准测试中表现优异,尤其在少步数生成场景下仍保持高质量,在美学、文字-图像一致性等方面接近甚至超过大参数量模型。这标志着高效率小尺寸文生图模型取得重要进展。
来源:https://mp.weixin.qq.com/s/16gTBVs8X_Q2NLTglZhi-A

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-22 17:31 , Processed in 0.275090 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表