Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了
阿里通义千问推出Qwen3新版本,总参数量235B,虽规模小于Kimi K2,但在基准测试中表现更优,尤其在数学推理任务AIME25中准确率从24.7%提升至70.3%。新模型采用MoE架构与GQA机制,支持256K上下文长度,并优化了指令遵循、逻辑推理及多语言知识覆盖等能力。Qwen官方宣布停止混合思维模式,当前版本仅支持Instruct模式,已上线网页端。同期,NVIDIA发布的OpenReasoning-Nemotron实为基于Qwen-2.5微调模型。随着Llama闭源、OpenAI未见开源动作,开源大模型竞争正加速向中国厂商倾斜。来源:https://mp.weixin.qq.com/s/6I89VO_fcycyDhd5UTyiLg
页:
[1]