OpenAI没说的秘密,Meta全揭了?华人一作GPT-4o同款技术,爆打扩散王者

[复制链接]
周大 发表于 2025-4-28 14:35:57 | 显示全部楼层 |阅读模式
研究人员提出了TokenShuffle方法,通过减少视觉token数量显著提升了自回归模型的高分辨率图像生成效率,并首次实现了2048×2048分辨率的图像生成。该方法无需修改Transformer架构,同时在GenEval和GenAI-Bench测试中取得了0.62和0.77的高分。大规模人类评估表明,新方法在文本对齐、美学质量和视觉缺陷方面表现出色,超越了现有扩散模型和自回归模型。训练过程分为三个阶段,逐步从低分辨率提升至高分辨率。此研究成果由来自Meta等机构的研究者共同完成,展现了自回归模型在图像生成领域的潜力。
来源:https://www.chinaz.com/2025/0428/1683007.shtml

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 11:53 , Processed in 0.291798 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表