周大 发表于 2025-9-1 14:35:42

王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

美团开源首个大模型Longcat-Flash-Chat,凭借560B参数的MoE架构和多项技术创新,在Agent工具调用、指令遵循、编程能力等基准测试中表现优异,部分指标超越DeepSeek-V3.1和Claude4 Sonnet。该模型在训练和推理阶段均采用高效策略,30天完成20T token训练,单卡生成速度超100 tokens/s。作为美团AI战略的重要成果,Longcat已应用于内部AI工具,API调用量占比达68%,体现了美团以业务驱动为核心、注重落地效果的AI布局方向。
来源:https://mp.weixin.qq.com/s/myqiJWSctD8QAt4BEWQdaA
页: [1]
查看完整版本: 王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1