周大 发表于 2024-6-16 14:02:52

GPT-4模拟能力受挫,研究显示其不适合作为世界模型

新研究表明,尽管大型语言模型(LLM)如GPT-4能集成大量知识,但它们在模拟复杂环境中的表现不尽如人意,特别是在处理涉及算术、常识和科学推理的状态转移时。通过对文本游戏的实验,研究人员发现GPT-4的模拟准确率远低于60%,远逊于人类的80%准确率,揭示了LLM在作为“世界模拟器”方面的局限性。
来源:https://mp.weixin.qq.com/s/-YjuaZ44SnVEsooYJea0Qw
页: [1]
查看完整版本: GPT-4模拟能力受挫,研究显示其不适合作为世界模型