13.8倍吞吐提升!浙大上海AI Lab等提出视觉生成新范式,从“下一个token”到“下一个邻域”

[复制链接]
周大 发表于 2025-3-30 14:57:46 | 显示全部楼层 |阅读模式
研究人员提出了一种全新的视觉生成模型NAR,通过“下一个邻域预测”机制大幅提升了图像和视频生成效率。相比传统方法,NAR模型减少了生成步骤,并通过维度导向解码头实现并行生成。实验表明,在ImageNet和UCF-101等数据集上,NAR模型不仅将吞吐量提升13.8倍至166倍,还保持了高质量生成效果,为未来AI应用提供了高效解决方案。
来源:https://mp.weixin.qq.com/s/xi-DiW7vt0lI8xQ60XGq-Q

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 15:04 , Processed in 0.303408 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表