AI决策的背后：思维链能否真正反映模型推理？

周大发表于 2025-3-9 14:53:23

上海交通大学张拳石教授针对DeepSeek-R1等AI模型展示的思维链（CoT）能否代表真实的推理机制提出疑问。他提出的“等效与或交互”理论，通过数学符号化解释神经网络的内在表征逻辑，为理解AI模型提供了新视角。该理论揭示了模型在医疗、自动驾驶等领域应用时潜在的风险，并强调了内在机理的重要性。此外，这一理论有助于理解模型的泛化性、鲁棒性和过拟合等问题，且具备无限拟合性、稀疏性和迁移泛化性等特性。张教授还指出，大规模模型训练和评估需深入考量内在机理，而不仅仅是端到端的正确率。解释性技术能像“CT扫描”一样指导模型训练，同时提出了建立新的硬核评价指标以改善现有评价体系。最后，张教授强调了理论创新的重要性，提倡寻找真正值得投入研究的问题。
来源：https://mp.weixin.qq.com/s/zG7SOVZPHRhHhS4tKjHCAQ

		自动登录	找回密码
密码			立即注册

课程导航

AI决策的背后：思维链能否真正反映模型推理？