Mini-Omni-Reasoner：实时推理，定义下一代端到端对话模型

周大发表于 2025-9-20 14:36:11

新加坡国立大学与南洋理工大学等团队联合提出Mini-Omni-Reasoner，旨在解决语音对话模型中推理深度与响应速度难以兼顾的问题。该模型创新性地采用“边思考边表达”（Thinking-in-Speaking）范式，通过Thinker-Talker架构和2:8 token级交替生成机制，在保证低延迟语音交互的同时实现高质量推理。基于Spoken-Math-Problems-3M数据集和五阶段训练流程，模型在Spoken-MQA测试中显著优于基座模型Qwen2.5-Omni-3B，展现出在复杂问题下兼具流畅性与逻辑性的潜力，为语音对话系统的实时推理提供了新路径。
来源：https://mp.weixin.qq.com/s/HnmKxecS4ZzrVj-rQC4Qrw

		自动登录	找回密码
密码			立即注册

课程导航

Mini-Omni-Reasoner：实时推理，定义下一代端到端对话模型