谷歌开源低成本高性能多模态大模型Gemma-3
谷歌开源多模态大模型Gemma-3,其参数规模从10亿至270亿不等,最大参数模型仅需一张H100即可高效推理。该模型性能仅次于DeepSeek的R1-671B,高于多个知名模型。Gemma-3在架构上进行创新,如局部和全局自注意力层交错、上下文长度扩展到128Ktoken等。它具备强大的多模态处理能力,支持140种语言,并通过知识蒸馏技术和多种奖励函数优化训练,表现出色。来源:https://tech.ifeng.com/c/8hf3gLjNAtm
页:
[1]