周大 发表于 2024-8-3 15:40:12

Meta揭秘LLM推理能力

Meta FAIR等机构的研究人员通过设计可控实验,揭示了大语言模型在解决小学数学题时展现的推理能力。他们构建的人工合成数据集iGSM帮助模型从零开始学习,并发现模型不仅能高效解决问题,还能进行复杂的思维过程,展现出通用智能的潜力。研究还发现模型深度比宽度更重要,并指出现有模型在处理复杂推理任务时存在局限性。
来源:https://mp.weixin.qq.com/s/XiM-qcZbJkguwyqvjEEPsg
页: [1]
查看完整版本: Meta揭秘LLM推理能力