周大 发表于 2025-1-7 15:31:21

Tokenization,再见!Meta提出大概念模型LCM,1B模型干翻70B?

Meta AI推出大概念模型(LCM),摒弃传统的token建模方式,转而使用高级别的「概念」进行推理。该模型通过观察和互动理解世界,摆脱了语言和模态的限制,支持200种语言。LCM在抽象层面上进行推理,具备强大的零样本泛化能力,特别是在长文档处理和多语言摘要任务中表现出色。实验表明,LCM的计算资源需求远低于传统大语言模型(LLM),在处理长上下文时优势尤为明显。专家预测,LCM可能使小规模模型达到与大规模LLM相当的性能,如1B参数模型性能媲美70B的Llama 4。
来源:https://tech.ifeng.com/c/8fwwQf6difB
页: [1]
查看完整版本: Tokenization,再见!Meta提出大概念模型LCM,1B模型干翻70B?