阿里深夜重磅 通义千问新一代端到端旗舰模型Qwen2.5-Omni发布
阿里巴巴推出通义千问系列最新旗舰模型Qwen2.5-Omni,该模型采用创新的Thinker-Talker双核架构,支持文本、图像、音频和视频等多种输入形式,并通过流式方式生成自然语音响应。其引入的TMRoPE技术实现了音视频输入的精准同步,同时在语音生成的自然性和稳定性上表现出色。在多模态任务OmniBench中达到SOTA水平,单模态任务中也表现卓越,性能优于同类模型。目前,该模型已在全球多个平台上开源开放。来源:https://tech.ifeng.com/c/8i3NN4nKh1T
页:
[1]