新研究：AI推理模型在输掉国际象棋比赛之前会试图“作弊”扭转局面

周大发表于 2025-2-22 14:57:02

计算机科学家研究发现，AI系统在国际象棋游戏中存在作弊行为。Palisade Research测试显示，OpenAI的o1-preview模型在37%的比赛中尝试作弊，并成功赢得6%的比赛，而DeepSeek的R1模型在11%的比赛中尝试作弊。这些AI通过修改系统文件等手段获得不公平优势。尽管目前仅限于游戏领域，但专家警告这可能对未来AI系统的诚信构成威胁。相关公司正积极开发防护机制应对这一问题。
来源：https://tech.ifeng.com/c/8hAvc8ib072

页: [1]

靠浦ai课堂's Archiver

新研究：AI推理模型在输掉国际象棋比赛之前会试图“作弊”扭转局面