周大 发表于 2025-4-19 16:10:37

一台3090就能跑Gemma 3 27B!谷歌发布Gemma 3全系QAT版模型

谷歌新推出的Gemma 3通过量化感知训练(QAT)大幅降低内存需求,例如27B模型从54GB降至14.1GB,使其能在消费级GPU(如RTX 3090/4060)上本地运行。官方模型已在Hugging Face和Kaggle上线,并兼容Ollama、LM Studio等多种工具。这一优化为资源有限的用户带来更强大的AI功能,社区反响热烈。
来源:https://mp.weixin.qq.com/s/OlfazHQpsrkQ_CtyQvXbJg
页: [1]
查看完整版本: 一台3090就能跑Gemma 3 27B!谷歌发布Gemma 3全系QAT版模型