小米发布ZipVoice系列语音合成模型 打破AI播客技术瓶颈

[复制链接]
周大 发表于 2025-9-12 14:37:49 | 显示全部楼层 |阅读模式
小米AI实验室Kaldi团队发布新一代语音合成模型ZipVoice与ZipVoice-Dialog,分别支持零样本单人及对话语音合成。新模型在参数量、推理速度及多项主客观性能指标上均优于现有方案,尤其在对话语音合成中实现了更自然的说话人切换。该技术可广泛应用于AI播客等多角色语音交互场景,具备重要研究价值与应用前景。
来源:https://tech.ifeng.com/c/8maK9EMqSx5

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 14:42 , Processed in 0.277797 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表