周大 发表于 2025-4-29 14:34:05

通义千问正式推出Qwen3系列模型 支持多语言和两种思考模式

通义千问团队发布Qwen3系列大语言模型,包含多种参数规模的密集模型与混合专家模型,并全面开源。新模型引入“思考模式”与“非思考模式”,支持复杂推理与快速响应。Qwen3预训练数据量达36万亿个token,较前代翻倍,覆盖119种语言。旗舰模型Qwen3-235B-A22B在多项测试中表现卓越,小型模型性能亦出色。技术上采用四阶段后训练流程,未来将从多维度优化模型能力。
来源:https://tech.ifeng.com/c/8iw71pdEYq9
页: [1]
查看完整版本: 通义千问正式推出Qwen3系列模型 支持多语言和两种思考模式