Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

周大发表于 2024-11-17 13:50:07

Nature发表研究，驳斥了大型语言模型（LLM）具有类人推理能力的说法。研究者设计了一系列「人类亲吻难题」，测试了7个大模型，发现LLM在理解性问题上的表现不稳定，与400名人类受试者相比，LLM在准确性和稳定性上显著较差。尽管LLM在许多任务中表现良好，但它们缺乏类人语言理解能力，更像是工具而非科学理论，其输出基于训练数据中的统计模式。
来源：https://mp.weixin.qq.com/s/c4-zh0-YZOjcq2qVFAgxBA

		自动登录	找回密码
密码			立即注册

课程导航

Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具