AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理

[复制链接]
周大 发表于 2025-4-15 14:50:46 | 显示全部楼层 |阅读模式
开源语音模型Orpheus通过其强大的拟人化语音、零样本克隆能力和低延迟特性,成功超越了ElevenLabs和OpenAI等顶级模型。Orpheus基于Llama架构,提供多种规模版本,最小仅1.5亿参数但仍能生成高质量语音。该模型在A100 40GB显卡上的流式推理速度甚至快于音频播放速度,延迟低至200毫秒,适用于实时应用。此外,Orpheus还支持情感标签调整和滑动窗口优化,彻底解决了传统模型中的popping问题,标志着开源TTS技术的重大突破。
来源:https://mp.weixin.qq.com/s/j5Zi3PAxOmvoxiU8n5tzog

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-2 08:16 , Processed in 0.291273 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表