周大 发表于 2025-4-29 14:30:11

深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1,2小时狂揽17k星

阿里巴巴发布的Qwen3正式成为全球最强开源大模型。该模型采用MoE架构,总参数量达235B,但激活只需22B,性能全面超越DeepSeek-R1和OpenAI o1等顶尖模型。Qwen3支持思考与非思考模式切换,显著提升推理效率,并在多项基准测试中刷新纪录,如AIME25测评中获得81.5分。此次开源包含8款混合推理模型,覆盖多种尺寸,支持119种语言。其多阶段训练数据量达36T,社区反响热烈,GitHub星数快速突破17k,展现了极高的关注度和实用性。
来源:https://mp.weixin.qq.com/s/t-3O-1lnSronDuLkcQ97aQ
页: [1]
查看完整版本: 深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1,2小时狂揽17k星