周大 发表于 2025-3-25 14:04:36

挖掘DiT的位置解耦特性,Personalize Anything免训练实现个性化图像生成

清华大学与北京航空航天大学联合研发的Personalize Anything架构,通过无需训练的方式实现个性化图像生成,解决了传统方法在细节还原、交互控制及应用拓展上的局限性。该技术基于对DiT架构的新发现,提出时间步适应标记替换机制,支持高精度细节还原和多种任务扩展,如多物体组合、布局引导生成等。实验表明,其性能在多个维度上优于现有方法,并有望在未来应用于视频、3D生成领域。
来源:https://mp.weixin.qq.com/s/jKiR-0_o8rFBKoAIhTho3g
页: [1]
查看完整版本: 挖掘DiT的位置解耦特性,Personalize Anything免训练实现个性化图像生成