周大 发表于 2025-7-30 14:42:06

凌晨,Qwen又更新了,3090就能跑,3B激活媲美GPT-4o

阿里通义实验室发布 Qwen3-30B-A3B 新版本模型 Instruct-2507,仅激活 30 亿参数即可媲美 Gemini 2.5-Flash 和 GPT-4o。该模型在 AIME25 和 Arena-Hard v2 测试中分别提升至 61.3 和 69.0,并在多项基准测试中接近甚至超过 DeepSeek-V3-0324。其通用能力、多语言支持、用户偏好对齐及 256K 长文本理解均有显著提升,现已开源并可在消费级 GPU 上运行。社区已推出量化版本,但模型不具备推理能力,在复杂代码生成任务中表现受限。此次更新再次体现 AI 技术的快速演进。
来源:https://mp.weixin.qq.com/s/g65uTnvrdoCv2MIMACMpDA
页: [1]
查看完整版本: 凌晨,Qwen又更新了,3090就能跑,3B激活媲美GPT-4o