周大 发表于 2025-3-21 16:39:09

OpenAI发布新一代语音模型,让AI智能体语音表达更自然

OpenAI发布语音转文本和文本转语音模型,包括gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts,大幅提升语音处理能力。新模型支持超100种语言,在单词错误率和稳定性上优于Whisper系列,并可通过指令控制语音风格,适用于客服和创意内容领域。此外,OpenAI公布了详细的收费方案,为开发者提供灵活的商业化选择。
来源:https://tech.ifeng.com/c/8hts6IbY8ry
页: [1]
查看完整版本: OpenAI发布新一代语音模型,让AI智能体语音表达更自然