凌晨,Qwen又更新了,3090就能跑,3B激活媲美GPT-4o

[复制链接]
周大 发表于 昨天 14:42 | 显示全部楼层 |阅读模式
阿里通义实验室发布 Qwen3-30B-A3B 新版本模型 Instruct-2507,仅激活 30 亿参数即可媲美 Gemini 2.5-Flash 和 GPT-4o。该模型在 AIME25 和 Arena-Hard v2 测试中分别提升至 61.3 和 69.0,并在多项基准测试中接近甚至超过 DeepSeek-V3-0324。其通用能力、多语言支持、用户偏好对齐及 256K 长文本理解均有显著提升,现已开源并可在消费级 GPU 上运行。社区已推出量化版本,但模型不具备推理能力,在复杂代码生成任务中表现受限。此次更新再次体现 AI 技术的快速演进。
来源:https://mp.weixin.qq.com/s/g65uTnvrdoCv2MIMACMpDA

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-7-31 20:38 , Processed in 0.283157 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表