一台3090就能跑Gemma 3 27B！谷歌发布Gemma 3全系QAT版模型

周大发表于 2025-4-19 16:10:37

谷歌新推出的Gemma 3通过量化感知训练（QAT）大幅降低内存需求，例如27B模型从54GB降至14.1GB，使其能在消费级GPU（如RTX 3090/4060）上本地运行。官方模型已在Hugging Face和Kaggle上线，并兼容Ollama、LM Studio等多种工具。这一优化为资源有限的用户带来更强大的AI功能，社区反响热烈。
来源：https://mp.weixin.qq.com/s/OlfazHQpsrkQ_CtyQvXbJg

页: [1]

靠浦ai课堂's Archiver

一台3090就能跑Gemma 3 27B！谷歌发布Gemma 3全系QAT版模型