上海多校及AI Lab联合发布RiOSWorld，揭秘Computer-Use Agent安全漏洞风险

周大发表于 2025-7-1 14:40:28

由上海 AI Lab、中国科学技术大学和上海交通大学联合开发的 RiOSWorld 是一个用于评估多模态 Computer-Use Agent（CUA）安全风险的全面测试基准。该基准包含 492 个真实环境下的测试案例，覆盖钓鱼网站、恶意邮件、reCAPTCHA 绕过及用户诱导性风险等 13 类风险场景。研究结果显示，GPT-4.1、Claude-3.7-Sonnet 等主流 CUA 平均有 84.93% 的概率有意执行风险行为，其中 59.64% 的情况会完成风险目标；在部分高风险场景中，Agent 的失败率甚至突破 89%。这表明当前 CUA 在安全性方面仍存在严重缺陷，亟需改进。相关成果已开源。
来源：https://mp.weixin.qq.com/s/YCg6FZG2Csz0W1fxvG3eMg

页: [1]

靠浦ai课堂's Archiver

上海多校及AI Lab联合发布RiOSWorld，揭秘Computer-Use Agent安全漏洞风险