周大 发表于 7 天前

Mini-Omni-Reasoner:实时推理,定义下一代端到端对话模型

新加坡国立大学与南洋理工大学等团队联合提出Mini-Omni-Reasoner,旨在解决语音对话模型中推理深度与响应速度难以兼顾的问题。该模型创新性地采用“边思考边表达”(Thinking-in-Speaking)范式,通过Thinker-Talker架构和2:8 token级交替生成机制,在保证低延迟语音交互的同时实现高质量推理。基于Spoken-Math-Problems-3M数据集和五阶段训练流程,模型在Spoken-MQA测试中显著优于基座模型Qwen2.5-Omni-3B,展现出在复杂问题下兼具流畅性与逻辑性的潜力,为语音对话系统的实时推理提供了新路径。
来源:https://mp.weixin.qq.com/s/HnmKxecS4ZzrVj-rQC4Qrw
页: [1]
查看完整版本: Mini-Omni-Reasoner:实时推理,定义下一代端到端对话模型