苹果《思考的错觉》再挨批，Claude与人类共著论文指出其三大关键缺陷

周大发表于 2025-6-14 14:41:16

苹果一篇论文质疑大型推理模型的泛化能力，但其研究方法引发争议。Anthropic和Open Philanthropy发表评论论文，指出苹果研究存在实验设计缺陷，如忽视模型token限制、错误评估模型能力及包含无解实例等问题。同时，这篇由AI与人类合著的论文建议改进评估方法以更好区分推理与文本生成能力，引发学界关注与讨论。
来源：https://mp.weixin.qq.com/s/hK8ruewbC-LR4vwHnJh4Pg

页: [1]

靠浦ai课堂's Archiver

苹果《思考的错觉》再挨批，Claude与人类共著论文指出其三大关键缺陷