苹果研究揭示大推理模型在高复杂度任务中易崩溃，Bengio兄弟合著论文揭AI推理局限

周大发表于 2025-6-6 13:55:53

苹果的一项新研究表明，大推理模型（LRM）在面对高复杂度任务时会出现“推理崩溃”。研究通过可控解谜环境测试发现，LRM在简单问题上表现不如传统大模型（LLM），中等复杂度时略占优势，但当问题过于复杂时，两类模型准确率均降至零。即使提供明确算法提示，LRM仍无法稳定执行任务，暴露出其推理能力的局限性。此外，研究还发现模型在简单问题上“过度思考”，复杂问题上则完全失效，不同谜题环境下的表现差异显著。这一研究为AI推理能力的进一步提升提供了重要参考。
来源：https://mp.weixin.qq.com/s/8B9wGazYnz07ShEE4rcE7g

页: [1]

靠浦ai课堂's Archiver

苹果研究揭示大推理模型在高复杂度任务中易崩溃，Bengio兄弟合著论文揭AI推理局限