周大 发表于 2025-8-7 14:27:22

Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus

Qwen团队发布Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两款端侧模型,支持256K上下文,分别侧重通用任务与高级推理。其中推理模型在AIME25测评中得分81.3,超过Gemini 2.5 Pro和Claude 4 Opus。4B参数量适配端侧部署,甚至可在树莓派运行。模型已在Hugging Face和魔搭社区开源,并提供详细部署建议,引发开发者关注。
来源:https://mp.weixin.qq.com/s/No7YJsxrIWaVbFZXGd0pbQ
页: [1]
查看完整版本: Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus