长视频AI数字人来了!字节×浙大推出商用级音频驱动数字人模型InfinityHuman

[复制链接]
周大 发表于 2025-9-4 14:46:58 | 显示全部楼层 |阅读模式
随着内容创作对长视频数字人需求的增长,字节跳动商业化 GenAI 团队联合浙江大学推出音频驱动视频生成模型 InfinityHuman,突破传统技术在长时序生成中的限制。该模型支持从静态图像和音频生成高分辨率、自然连贯的长视频,有效解决身份漂移和手部失真问题,并在电商、教育、自媒体等多场景实现商用。实验表明其在视觉真实感和时序一致性指标上优于主流方法,尤其在中文语音支持方面表现突出,已部署至商业化平台,推动 AI 数字人实用化进程。
来源:https://mp.weixin.qq.com/s/reH9XXQokvCosbqaEOJHFQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-16 08:36 , Processed in 0.288250 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表