通义千问正式推出Qwen3系列模型 支持多语言和两种思考模式

[复制链接]
周大 发表于 2025-4-29 14:34:05 | 显示全部楼层 |阅读模式
通义千问团队发布Qwen3系列大语言模型,包含多种参数规模的密集模型与混合专家模型,并全面开源。新模型引入“思考模式”与“非思考模式”,支持复杂推理与快速响应。Qwen3预训练数据量达36万亿个token,较前代翻倍,覆盖119种语言。旗舰模型Qwen3-235B-A22B在多项测试中表现卓越,小型模型性能亦出色。技术上采用四阶段后训练流程,未来将从多维度优化模型能力。
来源:https://tech.ifeng.com/c/8iw71pdEYq9

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-8 01:19 , Processed in 0.292299 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表