小米发布ZipVoice系列语音合成模型打破AI播客技术瓶颈

周大发表于 2025-9-12 14:37:49

小米AI实验室Kaldi团队发布新一代语音合成模型ZipVoice与ZipVoice-Dialog，分别支持零样本单人及对话语音合成。新模型在参数量、推理速度及多项主客观性能指标上均优于现有方案，尤其在对话语音合成中实现了更自然的说话人切换。该技术可广泛应用于AI播客等多角色语音交互场景，具备重要研究价值与应用前景。
来源：https://tech.ifeng.com/c/8maK9EMqSx5

		自动登录	找回密码
密码			立即注册

课程导航

小米发布ZipVoice系列语音合成模型 打破AI播客技术瓶颈

小米发布ZipVoice系列语音合成模型打破AI播客技术瓶颈