豆包语音模型实现高自然度小说演播

周大发表于 2025-2-25 14:41:08

豆包语音模型团队通过改进Seed-TTS框架，实现了无需额外标签的端到端声音合成。在数据处理、特征融合等方面进行了优化，使得该模型在小说演播场景下的音质、韵律、情感表达及多角色演绎等方面表现出色，经专业评测，其CMOS已达一流主播90%以上效果。目前，基于王明军、李满超两位演播大咖声音合成的千部有声书已上线番茄小说，涵盖了历史、悬疑等多种类型，为听书用户带来了更好的体验。
来源：https://www.chinaz.com/2025/0225/1671059.shtml

		自动登录	找回密码
密码			立即注册

课程导航

豆包语音模型实现高自然度小说演播