中山大学和字节发布「视频虚拟试穿」扩散模型VITON-DiT,一键生成换装后视频!

[复制链接]
周大 发表于 2024-6-7 16:05:23 | 显示全部楼层 |阅读模式
中山大学与字节跳动的研究团队近日发布了一项创新技术——VITON-DiT,这是一个基于Diffusion Transformer的视频虚拟试穿框架。VITON-DiT能一键生成换装视频,解决了现有技术在处理复杂视频时的难题。模型通过独特的注意力融合机制,成功地在保持人物动作和身份的同时,恢复了视频中的服装细节。实验表明,VITON-DiT在视觉质量和时间连贯性上优于其他方法。
来源:https://mp.weixin.qq.com/s/3tbkPzWLatqGxZh0qYiFUQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 16:10 , Processed in 0.292250 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表