谷歌开源低成本高性能多模态大模型Gemma-3

[复制链接]
周大 发表于 2025-3-13 15:07:33 | 显示全部楼层 |阅读模式
谷歌开源多模态大模型Gemma-3,其参数规模从10亿至270亿不等,最大参数模型仅需一张H100即可高效推理。该模型性能仅次于DeepSeek的R1-671B,高于多个知名模型。Gemma-3在架构上进行创新,如局部和全局自注意力层交错、上下文长度扩展到128Ktoken等。它具备强大的多模态处理能力,支持140种语言,并通过知识蒸馏技术和多种奖励函数优化训练,表现出色。
来源:https://tech.ifeng.com/c/8hf3gLjNAtm

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-6 17:02 , Processed in 0.291093 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表