周大 发表于 2025-3-27 14:49:25

阿里深夜重磅 通义千问新一代端到端旗舰模型Qwen2.5-Omni发布

阿里巴巴推出通义千问系列最新旗舰模型Qwen2.5-Omni,该模型采用创新的Thinker-Talker双核架构,支持文本、图像、音频和视频等多种输入形式,并通过流式方式生成自然语音响应。其引入的TMRoPE技术实现了音视频输入的精准同步,同时在语音生成的自然性和稳定性上表现出色。在多模态任务OmniBench中达到SOTA水平,单模态任务中也表现卓越,性能优于同类模型。目前,该模型已在全球多个平台上开源开放。
来源:https://tech.ifeng.com/c/8i3NN4nKh1T
页: [1]
查看完整版本: 阿里深夜重磅 通义千问新一代端到端旗舰模型Qwen2.5-Omni发布