菲尔兹奖得主亲测 大型语言模型在经典推理问题上集体“翻车”

[复制链接]
周大 发表于 2024-6-30 16:51:04 | 显示全部楼层 |阅读模式
菲尔兹奖得主Timothy Gowers近期测试发现,包括GPT-4o在内的大型语言模型无法成功解决经典的“狼-山羊-卷心菜”过河问题,这些模型在处理此类需要推理的任务时表现出显著缺陷。Gowers提出的“废话比率”揭示了模型给出错误答案的频繁程度。尽管LLM在某些基准测试中表现出色,但在实际的数学问题上往往失败,可能因过度依赖记忆而非理解问题本质。
来源:https://mp.weixin.qq.com/s/8mJHWTjzJZtdif3LjFivog

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 09:34 , Processed in 0.280307 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表