谷歌开源Gemma 3n：2G内存就能跑，100亿参数内最强多模态模型

周大发表于 2025-6-27 14:01:20

谷歌正式发布并开源了全新的端侧多模态大模型 Gemma 3n，该模型为移动设备带来了媲美云端的 AI 性能。其支持图像、音频、视频和文本输入，具备高效的内存使用设计，E2B 和 E4B 两个版本分别仅需 2GB 和 3GB 运行内存。新架构 MatFormer 支持模型弹性推理与自定义尺寸调整，PLE 技术进一步提升内存效率。Gemma 3n 在音频理解、视觉处理方面均有突破，集成自动语音识别与翻译功能，并搭载先进的 MobileNet-V5 视觉编码器。E4B 版本在 LMArena 测试中得分超过 1300，成为同类模型中的佼佼者。
来源：https://mp.weixin.qq.com/s/64QtpHWYTwxZkCTHY74JQg

页: [1]

靠浦ai课堂's Archiver

谷歌开源Gemma 3n：2G内存就能跑，100亿参数内最强多模态模型