周大 发表于 2025-5-16 14:00:30

DiffMoE:动态Token选择助力扩散模型性能飞跃,快手&清华团队打造视觉生成新标杆!

清华大学与快手可灵团队联合开发的 DiffMoE 模型,通过动态 token 选择和全局 token 池设计,显著提升扩散模型效率与性能。该模型引入动态容量预测器,优化推理阶段资源分配,实现“按需计算”。在 ImageNet 基准测试中,DiffMoE 以 4.58 亿参数超越拥有 6.75 亿参数的 Dense-DiT-XL 模型,并在文本到图像生成任务中展现卓越泛化能力。实验结果表明,DiffMoE 不仅性能优越,还具备良好的扩展性与跨任务适配能力。
来源:https://mp.weixin.qq.com/s/HSRL-DMnIamU02OxJwPGhg
页: [1]
查看完整版本: DiffMoE:动态Token选择助力扩散模型性能飞跃,快手&清华团队打造视觉生成新标杆!