SnapGen:移动端高效文生图模型
Snap研究院Creative Vision团队推出专为移动设备设计的文生图模型SnapGen。该模型仅有379M参数,在iPhone 16 Pro-Max上1.4秒即可生成1024x1024图片。研究团队通过优化UNet架构和图像解码器、采用多级知识蒸馏等技术实现高效训练。实验表明,SnapGen在多项基准测试中表现优异,尤其在少步数生成场景下仍保持高质量,在美学、文字-图像一致性等方面接近甚至超过大参数量模型。这标志着高效率小尺寸文生图模型取得重要进展。来源:https://mp.weixin.qq.com/s/16gTBVs8X_Q2NLTglZhi-A
页:
[1]