Meta发布 LIama 4发布重夺开源第一!
Meta推出了基于MoE架构的Llama 4系列模型,包括已发布的Llama 4 Scout和Llama 4 Maverick,以及尚在训练中的Llama 4 Behemoth。Scout和Maverick分别具有16和128位专家模型,参数量均为170亿,但Maverick性能更优,超越GPT-4o和Gemini 2.0 Flash,在多个评测中表现突出。Behemoth参数量高达2万亿,正在训练中,预计性能更强。Llama 4系列具备长上下文窗口(Scout达10M)和原生多模态设计,支持图片问答等功能。此外,Meta在模型API价格上采取低价策略,性价比高于DeepSeek。训练方面,Llama 4采用混合专家MoE架构,预训练数据量达30多万亿token,后训练策略进一步优化了模型性能。来源:https://mp.weixin.qq.com/s/-HIy0HLBAobSdNLpsuXZwg
页:
[1]