豆包语音模型实现高自然度小说演播

[复制链接]
周大 发表于 2025-2-25 14:41:08 | 显示全部楼层 |阅读模式
豆包语音模型团队通过改进Seed-TTS框架,实现了无需额外标签的端到端声音合成。在数据处理、特征融合等方面进行了优化,使得该模型在小说演播场景下的音质、韵律、情感表达及多角色演绎等方面表现出色,经专业评测,其CMOS已达一流主播90%以上效果。目前,基于王明军、李满超两位演播大咖声音合成的千部有声书已上线番茄小说,涵盖了历史、悬疑等多种类型,为听书用户带来了更好的体验。
来源:https://www.chinaz.com/2025/0225/1671059.shtml

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 10:15 , Processed in 0.273468 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表