周大 发表于 2025-7-16 14:51:39

紫东太初联合长城汽车开源OpenS2S共情语音大模型,全技术栈透明开放

紫东太初团队联合长城汽车AI Lab推出端到端共情语音语言大模型OpenS2S,并实现全面开源。该模型基于流式交错解码架构,结合大语言模型与文本到语音生成技术,支持多说话者、多情感语音生成。团队开源了模型权重、训练代码、数据集等全部资源,推动共情语音系统研究。OpenS2S在VoiceBench和URO-Bench评测中表现优异,尤其在语音理解与共情表达方面,展现了高质量和低训练成本的优势,为语音交互研究提供了透明、可复现的基础。
来源:https://mp.weixin.qq.com/s/rspPdaIT-i7IksUsqkkjBQ
页: [1]
查看完整版本: 紫东太初联合长城汽车开源OpenS2S共情语音大模型,全技术栈透明开放