OpenAI发布49页长文,讲述o1的安全机制

[复制链接]
周大 发表于 2024-12-14 15:02:45 | 显示全部楼层 |阅读模式
OpenAI 发布了 o1 系统卡,详细评估了 o1 和 o1-mini 模型的安全性。通过大规模强化学习和思维链推理,o1 在高风险提问中表现出更高的安全性,但在 API 上允许开发者添加自定义消息,增加了潜在风险。外部红队测试揭示了 o1 在细节与安全平衡、互动深度等方面的不足。尽管如此,o1 模型在多个安全指标上仍优于 GPT-4o,展示了其在功能和安全性上的双重优势。
来源:https://mp.weixin.qq.com/s/-zPVmr6_dA35j-YZAIqGJg

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-23 16:20 , Processed in 0.268441 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表