中山大学和字节发布「视频虚拟试穿」扩散模型VITON-DiT,一键生成换装后视频!
中山大学与字节跳动的研究团队近日发布了一项创新技术——VITON-DiT,这是一个基于Diffusion Transformer的视频虚拟试穿框架。VITON-DiT能一键生成换装视频,解决了现有技术在处理复杂视频时的难题。模型通过独特的注意力融合机制,成功地在保持人物动作和身份的同时,恢复了视频中的服装细节。实验表明,VITON-DiT在视觉质量和时间连贯性上优于其他方法。来源:https://mp.weixin.qq.com/s/3tbkPzWLatqGxZh0qYiFUQ
页:
[1]