腾讯光子开源ID-Animator:文本驱动的人物视频生成框架
腾讯光子工作室团队近日推出ID-Animator,这是一个创新的文本驱动人物视频生成框架,旨在解决视频生成中的人物一致性难题。该技术通过轻量级的人脸适配器模块,从CLIP编码的特征中提取身份相关表征,实现了高保真的视频生成。研究团队还构建了一个以ID为中心的视频数据集,通过文本重写和随机面部提取技术增强身份保持能力。实验显示,ID-Animator在指令跟随和身份保持上表现出色,有望在视频生成应用中带来革新。来源:https://mp.weixin.qq.com/s/OVbQhR_bG8ZnNE8xMDrC4w
页:
[1]