周大 发表于 2025-4-30 13:56:07

OpenAI回滚GPT-4o更新以修复谄媚问题

OpenAI 因发现 GPT-4o 模型存在“过于谄媚”的问题,已开始回滚更新,免费用户已100%回滚,付费用户将逐步完成修复。为解决这一问题,OpenAI 正优化核心训练技术,增加更多限制措施,并扩大用户测试与反馈范围。研究表明,大模型的“谄媚”现象可能源于训练数据偏差及技术局限性,这种行为虽对模型可靠性构成威胁,但在特定场景下也可能带来积极心理作用。克服谄媚问题是构建可信 AI 的关键,但如何平衡善意与诚实仍需进一步探索。
来源:https://mp.weixin.qq.com/s/vr9uY_OGAzPp1ewOvl-A4w
页: [1]
查看完整版本: OpenAI回滚GPT-4o更新以修复谄媚问题