通义千问正式推出Qwen3系列模型支持多语言和两种思考模式

周大发表于 2025-4-29 14:34:05

通义千问团队发布Qwen3系列大语言模型，包含多种参数规模的密集模型与混合专家模型，并全面开源。新模型引入“思考模式”与“非思考模式”，支持复杂推理与快速响应。Qwen3预训练数据量达36万亿个token，较前代翻倍，覆盖119种语言。旗舰模型Qwen3-235B-A22B在多项测试中表现卓越，小型模型性能亦出色。技术上采用四阶段后训练流程，未来将从多维度优化模型能力。
来源：https://tech.ifeng.com/c/8iw71pdEYq9

页: [1]

靠浦ai课堂's Archiver

通义千问正式推出Qwen3系列模型 支持多语言和两种思考模式

通义千问正式推出Qwen3系列模型支持多语言和两种思考模式