Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了

周大发表于 2025-7-22 14:22:55

阿里通义千问推出Qwen3新版本，总参数量235B，虽规模小于Kimi K2，但在基准测试中表现更优，尤其在数学推理任务AIME25中准确率从24.7%提升至70.3%。新模型采用MoE架构与GQA机制，支持256K上下文长度，并优化了指令遵循、逻辑推理及多语言知识覆盖等能力。Qwen官方宣布停止混合思维模式，当前版本仅支持Instruct模式，已上线网页端。同期，NVIDIA发布的OpenReasoning-Nemotron实为基于Qwen-2.5微调模型。随着Llama闭源、OpenAI未见开源动作，开源大模型竞争正加速向中国厂商倾斜。
来源：https://mp.weixin.qq.com/s/6I89VO_fcycyDhd5UTyiLg

页: [1]

靠浦ai课堂's Archiver

Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了