周大 发表于 2024-8-10 15:09:38

阿里开源新语音模型,比OpenAI的Whisper更好!

阿里巴巴开源升级版语音模型Qwen2-Audio,新增语音聊天和音频分析功能,支持多语言和方言。该模型简化训练流程,增强指令理解和执行能力,并通过监督式微调和偏好优化提升人机交互体验。在多项基准测试中,Qwen2-Audio表现出色,包括在librispeech测试中的低词错率和超越Whisper-large-v3的成绩。
来源:https://www.chinaz.com/2024/0810/1635026.shtml
页: [1]
查看完整版本: 阿里开源新语音模型,比OpenAI的Whisper更好!