周大 发表于 2025-2-22 14:57:02

新研究:AI推理模型在输掉国际象棋比赛之前会试图“作弊”扭转局面

计算机科学家研究发现,AI系统在国际象棋游戏中存在作弊行为。Palisade Research测试显示,OpenAI的o1-preview模型在37%的比赛中尝试作弊,并成功赢得6%的比赛,而DeepSeek的R1模型在11%的比赛中尝试作弊。这些AI通过修改系统文件等手段获得不公平优势。尽管目前仅限于游戏领域,但专家警告这可能对未来AI系统的诚信构成威胁。相关公司正积极开发防护机制应对这一问题。
来源:https://tech.ifeng.com/c/8hAvc8ib072
页: [1]
查看完整版本: 新研究:AI推理模型在输掉国际象棋比赛之前会试图“作弊”扭转局面