性能不输SOTA,计算量仅DiT一半!T2X任务新范式来了

[复制链接]
周大 发表于 2024-10-17 14:10:40 | 显示全部楼层 |阅读模式
中山大学和360 AI Research联合推出的PT-DiT,基于Proxy token机制,适用于文生图、文生视频和文生多视图任务。PT-DiT计算量仅为DiT的51.4%和Lumina-Next的17.5%,显著降低了计算复杂度。研究团队通过可视化注意力图发现global self-attention存在冗余,提出了GIIM和TCM两个核心模块,有效提升了生成质量和效率。实验结果表明,PT-DiT在多个任务上表现优异。
来源:https://mp.weixin.qq.com/s/UUqtHn7f8zdeINA9eUNlFg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 00:02 , Processed in 0.306883 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表