周大 发表于 2025-3-21 16:39:38

OpenAI深夜发布3个全新的语音模型,一手实测都在这了。

OpenAI发布了两款STT模型(gpt-4o-transcribe与gpt-4o-mini-transcribe)以及一款TTS模型(gpt-4o-mini-tts)。新模型在语音转文字准确率方面表现出色,在FLEURS数据集上词错率优于Google的Gemini和Anthropic的scribe。此外,模型具有自动清噪功能,可有效过滤背景噪音。其中gpt-4o-mini-transcribe每分钟仅需0.02元人民币,性价比突出。然而,TTS模型在中文发音上存在明显不足,而英文发音则较为理想,支持情绪定制且价格低廉,仅为每分钟约0.1元人民币。
来源:https://www.chinaz.com/2025/0321/1675974.shtml
页: [1]
查看完整版本: OpenAI深夜发布3个全新的语音模型,一手实测都在这了。