Hallo：音频驱动的逼真口型同步视频生成技术

周大发表于 2024-6-18 14:59:19

复旦大学、百度等机构的研究人员推出Hallo，一种能根据音频和人像生成高度同步的口型视频的技术。Hallo通过分层音频驱动视觉合成，精确匹配音频和人脸表情，已在多个数据集上超越现有最佳方法。尽管有局限性，Hallo展现了强大的人像生成和个性化表达能力。
来源：https://mp.weixin.qq.com/s/JMKnd56oT-WfOKBeWTyxeA

		自动登录	找回密码
密码			立即注册

课程导航

Hallo：音频驱动的逼真口型同步视频生成技术