中山大学和字节发布「视频虚拟试穿」扩散模型VITON-DiT，一键生成换装后视频！

周大发表于 2024-6-7 16:05:23

中山大学与字节跳动的研究团队近日发布了一项创新技术——VITON-DiT，这是一个基于Diffusion Transformer的视频虚拟试穿框架。VITON-DiT能一键生成换装视频，解决了现有技术在处理复杂视频时的难题。模型通过独特的注意力融合机制，成功地在保持人物动作和身份的同时，恢复了视频中的服装细节。实验表明，VITON-DiT在视觉质量和时间连贯性上优于其他方法。
来源：https://mp.weixin.qq.com/s/3tbkPzWLatqGxZh0qYiFUQ

页: [1]

靠浦ai课堂's Archiver

中山大学和字节发布「视频虚拟试穿」扩散模型VITON-DiT，一键生成换装后视频！