港中大与趣丸科技推出超自然语音克隆模型 MaskGCT

[复制链接]
周大 发表于 2024-10-30 15:43:12 | 显示全部楼层 |阅读模式
港中大(深圳)与趣丸科技联合推出新一代大规模声音克隆 TTS 模型 MaskGCT。该模型在 10 万小时多语言数据上训练,具备超自然的语音克隆、风格迁移和跨语言生成能力。MaskGCT 采用全非自回归掩码生成编解码器 Transformer,无需文本与语音对齐监督。实验表明,其在语音质量、相似度和可理解性方面优于当前最先进的零样本 TTS 系统。MaskGCT 已在开源系统 Amphion 发布,并应用于多语种速译智能视听平台“趣丸千音”,显著降低视频翻译成本和制作周期。
来源:https://mp.weixin.qq.com/s/7QZi0IpILyl3R8wpHXSbtA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-17 18:53 , Processed in 0.289299 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表