OpenAI发布49页长文,讲述o1的安全机制
OpenAI 发布了 o1 系统卡,详细评估了 o1 和 o1-mini 模型的安全性。通过大规模强化学习和思维链推理,o1 在高风险提问中表现出更高的安全性,但在 API 上允许开发者添加自定义消息,增加了潜在风险。外部红队测试揭示了 o1 在细节与安全平衡、互动深度等方面的不足。尽管如此,o1 模型在多个安全指标上仍优于 GPT-4o,展示了其在功能和安全性上的双重优势。来源:https://mp.weixin.qq.com/s/-zPVmr6_dA35j-YZAIqGJg
页:
[1]