腾讯光子开源ID-Animator:文本驱动的人物视频生成框架

[复制链接]
周大 发表于 2024-5-18 15:26:38 | 显示全部楼层 |阅读模式
腾讯光子工作室团队近日推出ID-Animator,这是一个创新的文本驱动人物视频生成框架,旨在解决视频生成中的人物一致性难题。该技术通过轻量级的人脸适配器模块,从CLIP编码的特征中提取身份相关表征,实现了高保真的视频生成。研究团队还构建了一个以ID为中心的视频数据集,通过文本重写和随机面部提取技术增强身份保持能力。实验显示,ID-Animator在指令跟随和身份保持上表现出色,有望在视频生成应用中带来革新。
来源:https://mp.weixin.qq.com/s/OVbQhR_bG8ZnNE8xMDrC4w

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-9 02:37 , Processed in 0.351409 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表