AI决策的背后:思维链能否真正反映模型推理?

[复制链接]
周大 发表于 2025-3-9 14:53:23 | 显示全部楼层 |阅读模式
上海交通大学张拳石教授针对DeepSeek-R1等AI模型展示的思维链(CoT)能否代表真实的推理机制提出疑问。他提出的“等效与或交互”理论,通过数学符号化解释神经网络的内在表征逻辑,为理解AI模型提供了新视角。该理论揭示了模型在医疗、自动驾驶等领域应用时潜在的风险,并强调了内在机理的重要性。此外,这一理论有助于理解模型的泛化性、鲁棒性和过拟合等问题,且具备无限拟合性、稀疏性和迁移泛化性等特性。张教授还指出,大规模模型训练和评估需深入考量内在机理,而不仅仅是端到端的正确率。解释性技术能像“CT扫描”一样指导模型训练,同时提出了建立新的硬核评价指标以改善现有评价体系。最后,张教授强调了理论创新的重要性,提倡寻找真正值得投入研究的问题。
来源:https://mp.weixin.qq.com/s/zG7SOVZPHRhHhS4tKjHCAQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-12 05:39 , Processed in 0.284955 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表