Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具

[复制链接]
周大 发表于 2024-11-17 13:50:07 | 显示全部楼层 |阅读模式
Nature发表研究,驳斥了大型语言模型(LLM)具有类人推理能力的说法。研究者设计了一系列「人类亲吻难题」,测试了7个大模型,发现LLM在理解性问题上的表现不稳定,与400名人类受试者相比,LLM在准确性和稳定性上显著较差。尽管LLM在许多任务中表现良好,但它们缺乏类人语言理解能力,更像是工具而非科学理论,其输出基于训练数据中的统计模式。
来源:https://mp.weixin.qq.com/s/c4-zh0-YZOjcq2qVFAgxBA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-26 18:17 , Processed in 0.277470 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表