周大 发表于 4 天前

Meta开源MobileLLM-R1系列小语言AI模型:参数量不到10亿、专攻数学编程科学问题

Meta 推出 MobileLLM-R1 系列小语言模型,提供 1.4 亿至 9.5 亿参数版本,专为移动端等轻量设备优化,聚焦数学、编程与科学任务。尽管最大模型仅用不到 5TB 数据训练,在多项基准测试中表现超越使用 36TB 数据训练的 Qwen 3-0.6B,且在 MATH 测试中准确率达 Olmo 1.24B 的 5 倍。模型已通过 Apache 2.0 协议开源,支持 vLLM 推理并上线 Hugging Face。
来源:https://tech.ifeng.com/c/8mrXuenpjxj
页: [1]
查看完整版本: Meta开源MobileLLM-R1系列小语言AI模型:参数量不到10亿、专攻数学编程科学问题