长视频AI数字人来了！字节×浙大推出商用级音频驱动数字人模型InfinityHuman

周大发表于 2025-9-4 14:46:58

随着内容创作对长视频数字人需求的增长，字节跳动商业化 GenAI 团队联合浙江大学推出音频驱动视频生成模型 InfinityHuman，突破传统技术在长时序生成中的限制。该模型支持从静态图像和音频生成高分辨率、自然连贯的长视频，有效解决身份漂移和手部失真问题，并在电商、教育、自媒体等多场景实现商用。实验表明其在视觉真实感和时序一致性指标上优于主流方法，尤其在中文语音支持方面表现突出，已部署至商业化平台，推动 AI 数字人实用化进程。
来源：https://mp.weixin.qq.com/s/reH9XXQokvCosbqaEOJHFQ

		自动登录	找回密码
密码			立即注册

课程导航

长视频AI数字人来了！字节×浙大推出商用级音频驱动数字人模型InfinityHuman