Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

[复制链接]
周大 发表于 2025-7-22 14:22:55 | 显示全部楼层 |阅读模式
阿里通义千问推出Qwen3新版本,总参数量235B,虽规模小于Kimi K2,但在基准测试中表现更优,尤其在数学推理任务AIME25中准确率从24.7%提升至70.3%。新模型采用MoE架构与GQA机制,支持256K上下文长度,并优化了指令遵循、逻辑推理及多语言知识覆盖等能力。Qwen官方宣布停止混合思维模式,当前版本仅支持Instruct模式,已上线网页端。同期,NVIDIA发布的OpenReasoning-Nemotron实为基于Qwen-2.5微调模型。随着Llama闭源、OpenAI未见开源动作,开源大模型竞争正加速向中国厂商倾斜。
来源:https://mp.weixin.qq.com/s/6I89VO_fcycyDhd5UTyiLg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 08:11 , Processed in 0.281577 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表