周大 发表于 2025-6-6 13:55:53

苹果研究揭示大推理模型在高复杂度任务中易崩溃,Bengio兄弟合著论文揭AI推理局限

苹果的一项新研究表明,大推理模型(LRM)在面对高复杂度任务时会出现“推理崩溃”。研究通过可控解谜环境测试发现,LRM在简单问题上表现不如传统大模型(LLM),中等复杂度时略占优势,但当问题过于复杂时,两类模型准确率均降至零。即使提供明确算法提示,LRM仍无法稳定执行任务,暴露出其推理能力的局限性。此外,研究还发现模型在简单问题上“过度思考”,复杂问题上则完全失效,不同谜题环境下的表现差异显著。这一研究为AI推理能力的进一步提升提供了重要参考。
来源:https://mp.weixin.qq.com/s/8B9wGazYnz07ShEE4rcE7g
页: [1]
查看完整版本: 苹果研究揭示大推理模型在高复杂度任务中易崩溃,Bengio兄弟合著论文揭AI推理局限