Mini-Omni-Reasoner:实时推理,定义下一代端到端对话模型

[复制链接]
周大 发表于 7 天前 | 显示全部楼层 |阅读模式
新加坡国立大学与南洋理工大学等团队联合提出Mini-Omni-Reasoner,旨在解决语音对话模型中推理深度与响应速度难以兼顾的问题。该模型创新性地采用“边思考边表达”(Thinking-in-Speaking)范式,通过Thinker-Talker架构和2:8 token级交替生成机制,在保证低延迟语音交互的同时实现高质量推理。基于Spoken-Math-Problems-3M数据集和五阶段训练流程,模型在Spoken-MQA测试中显著优于基座模型Qwen2.5-Omni-3B,展现出在复杂问题下兼具流畅性与逻辑性的潜力,为语音对话系统的实时推理提供了新路径。
来源:https://mp.weixin.qq.com/s/HnmKxecS4ZzrVj-rQC4Qrw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 14:37 , Processed in 0.332519 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表