谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型
谷歌正式发布并开源了全新的端侧多模态大模型 Gemma 3n,该模型为移动设备带来了媲美云端的 AI 性能。其支持图像、音频、视频和文本输入,具备高效的内存使用设计,E2B 和 E4B 两个版本分别仅需 2GB 和 3GB 运行内存。新架构 MatFormer 支持模型弹性推理与自定义尺寸调整,PLE 技术进一步提升内存效率。Gemma 3n 在音频理解、视觉处理方面均有突破,集成自动语音识别与翻译功能,并搭载先进的 MobileNet-V5 视觉编码器。E4B 版本在 LMArena 测试中得分超过 1300,成为同类模型中的佼佼者。来源:https://mp.weixin.qq.com/s/64QtpHWYTwxZkCTHY74JQg
页:
[1]