豆包语音模型实现高自然度小说演播
豆包语音模型团队通过改进Seed-TTS框架,实现了无需额外标签的端到端声音合成。在数据处理、特征融合等方面进行了优化,使得该模型在小说演播场景下的音质、韵律、情感表达及多角色演绎等方面表现出色,经专业评测,其CMOS已达一流主播90%以上效果。目前,基于王明军、李满超两位演播大咖声音合成的千部有声书已上线番茄小说,涵盖了历史、悬疑等多种类型,为听书用户带来了更好的体验。来源:https://www.chinaz.com/2025/0225/1671059.shtml
页:
[1]