王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

[复制链接]
周大 发表于 2025-9-1 14:35:42 | 显示全部楼层 |阅读模式
美团开源首个大模型Longcat-Flash-Chat,凭借560B参数的MoE架构和多项技术创新,在Agent工具调用、指令遵循、编程能力等基准测试中表现优异,部分指标超越DeepSeek-V3.1和Claude4 Sonnet。该模型在训练和推理阶段均采用高效策略,30天完成20T token训练,单卡生成速度超100 tokens/s。作为美团AI战略的重要成果,Longcat已应用于内部AI工具,API调用量占比达68%,体现了美团以业务驱动为核心、注重落地效果的AI布局方向。
来源:https://mp.weixin.qq.com/s/myqiJWSctD8QAt4BEWQdaA

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 18:44 , Processed in 0.281902 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表