谷歌开源低成本高性能多模态大模型Gemma-3

周大发表于 2025-3-13 15:07:33

谷歌开源多模态大模型Gemma-3，其参数规模从10亿至270亿不等，最大参数模型仅需一张H100即可高效推理。该模型性能仅次于DeepSeek的R1-671B，高于多个知名模型。Gemma-3在架构上进行创新，如局部和全局自注意力层交错、上下文长度扩展到128Ktoken等。它具备强大的多模态处理能力，支持140种语言，并通过知识蒸馏技术和多种奖励函数优化训练，表现出色。
来源：https://tech.ifeng.com/c/8hf3gLjNAtm

页: [1]

靠浦ai课堂's Archiver

谷歌开源低成本高性能多模态大模型Gemma-3