周大 发表于 2025-9-12 14:37:49

小米发布ZipVoice系列语音合成模型 打破AI播客技术瓶颈

小米AI实验室Kaldi团队发布新一代语音合成模型ZipVoice与ZipVoice-Dialog,分别支持零样本单人及对话语音合成。新模型在参数量、推理速度及多项主客观性能指标上均优于现有方案,尤其在对话语音合成中实现了更自然的说话人切换。该技术可广泛应用于AI播客等多角色语音交互场景,具备重要研究价值与应用前景。
来源:https://tech.ifeng.com/c/8maK9EMqSx5
页: [1]
查看完整版本: 小米发布ZipVoice系列语音合成模型 打破AI播客技术瓶颈