Meta发布 LIama 4发布重夺开源第一!

[复制链接]
周大 发表于 2025-4-6 14:47:08 | 显示全部楼层 |阅读模式
Meta推出了基于MoE架构的Llama 4系列模型,包括已发布的Llama 4 Scout和Llama 4 Maverick,以及尚在训练中的Llama 4 Behemoth。Scout和Maverick分别具有16和128位专家模型,参数量均为170亿,但Maverick性能更优,超越GPT-4o和Gemini 2.0 Flash,在多个评测中表现突出。Behemoth参数量高达2万亿,正在训练中,预计性能更强。Llama 4系列具备长上下文窗口(Scout达10M)和原生多模态设计,支持图片问答等功能。此外,Meta在模型API价格上采取低价策略,性价比高于DeepSeek。训练方面,Llama 4采用混合专家MoE架构,预训练数据量达30多万亿token,后训练策略进一步优化了模型性能。
来源:https://mp.weixin.qq.com/s/-HIy0HLBAobSdNLpsuXZwg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-22 18:14 , Processed in 0.297033 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表