深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1,2小时狂揽17k星

[复制链接]
周大 发表于 2025-4-29 14:30:11 | 显示全部楼层 |阅读模式
阿里巴巴发布的Qwen3正式成为全球最强开源大模型。该模型采用MoE架构,总参数量达235B,但激活只需22B,性能全面超越DeepSeek-R1和OpenAI o1等顶尖模型。Qwen3支持思考与非思考模式切换,显著提升推理效率,并在多项基准测试中刷新纪录,如AIME25测评中获得81.5分。此次开源包含8款混合推理模型,覆盖多种尺寸,支持119种语言。其多阶段训练数据量达36T,社区反响热烈,GitHub星数快速突破17k,展现了极高的关注度和实用性。
来源:https://mp.weixin.qq.com/s/t-3O-1lnSronDuLkcQ97aQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 06:14 , Processed in 0.309651 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表