Hallo:音频驱动的逼真口型同步视频生成技术

[复制链接]
周大 发表于 2024-6-18 14:59:19 | 显示全部楼层 |阅读模式
复旦大学、百度等机构的研究人员推出Hallo,一种能根据音频和人像生成高度同步的口型视频的技术。Hallo通过分层音频驱动视觉合成,精确匹配音频和人脸表情,已在多个数据集上超越现有最佳方法。尽管有局限性,Hallo展现了强大的人像生成和个性化表达能力。
来源:https://mp.weixin.qq.com/s/JMKnd56oT-WfOKBeWTyxeA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-7-6 15:49 , Processed in 0.297537 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表