阿里发布QwQ-32B推理模型性能比肩671B DeepSeek-R1

[复制链接]
周大 发表于 2025-3-6 15:27:26 | 显示全部楼层 |阅读模式
Qwen发布了32B参数规模的推理模型QwQ-32B,在性能上可与671B参数的DeepSeek R1相媲美。该模型采用独特的强化学习训练方法,分为两个阶段分别优化专业能力和通用能力。值得注意的是,QwQ-32B未采用复杂的MoE架构,使得其能在单台机器上高效运行,并将运行成本降低至同类竞品的约1/10。目前该模型已开源并提供在线体验。
来源:https://mp.weixin.qq.com/s/ZtnUV0RLf6_CR04Sbm-Wyw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 02:12 , Processed in 0.365914 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表