OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

[复制链接]
周大 发表于 2025-9-1 14:28:11 | 显示全部楼层 |阅读模式
OpenAI发布语音模型GPT-realtime,具备多模态能力,能生成自然流畅语音并还原人类语调、情感与语速变化,支持图像理解,适用于客服、教育、医疗等多个领域。该模型在复杂指令执行、工具调用及语音表现力方面表现出色,可捕捉非语言线索并实时调整语气,新增两种语音风格并优化现有效果,提升语音智能体交互质量。
来源:https://www.chinaz.com/2025/0901/1707155.shtml

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 18:40 , Processed in 0.302389 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表