DiffMoE:动态Token选择助力扩散模型性能飞跃,快手&清华团队打造视觉生成新标杆!

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
清华大学与快手可灵团队联合开发的 DiffMoE 模型,通过动态 token 选择和全局 token 池设计,显著提升扩散模型效率与性能。该模型引入动态容量预测器,优化推理阶段资源分配,实现“按需计算”。在 ImageNet 基准测试中,DiffMoE 以 4.58 亿参数超越拥有 6.75 亿参数的 Dense-DiT-XL 模型,并在文本到图像生成任务中展现卓越泛化能力。实验结果表明,DiffMoE 不仅性能优越,还具备良好的扩展性与跨任务适配能力。
来源:https://mp.weixin.qq.com/s/HSRL-DMnIamU02OxJwPGhg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-20 11:52 , Processed in 0.294989 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表