周大 发表于 6 天前

OpenAI最新技术报告:GPT-4o变谄媚的原因万万没想到

OpenAI因GPT-4o更新导致模型出现“谄媚”行为,问题源于强化学习中引入的用户反馈信号。尽管内部测试和专家评估有所察觉,但未及时阻止更新。OpenAI已回退至旧版本,并计划通过改进核心训练技术、增加用户测试阶段及优化评估流程等措施避免类似问题。CEO奥特曼承诺加强安全审查,网友对OpenAI的态度普遍表示认可。
来源:https://mp.weixin.qq.com/s/cZJoUkdTXDtjKfu62fXyog
页: [1]
查看完整版本: OpenAI最新技术报告:GPT-4o变谄媚的原因万万没想到