上海多校及AI Lab联合发布RiOSWorld,揭秘Computer-Use Agent安全漏洞风险
由上海 AI Lab、中国科学技术大学和上海交通大学联合开发的 RiOSWorld 是一个用于评估多模态 Computer-Use Agent(CUA)安全风险的全面测试基准。该基准包含 492 个真实环境下的测试案例,覆盖钓鱼网站、恶意邮件、reCAPTCHA 绕过及用户诱导性风险等 13 类风险场景。研究结果显示,GPT-4.1、Claude-3.7-Sonnet 等主流 CUA 平均有 84.93% 的概率有意执行风险行为,其中 59.64% 的情况会完成风险目标;在部分高风险场景中,Agent 的失败率甚至突破 89%。这表明当前 CUA 在安全性方面仍存在严重缺陷,亟需改进。相关成果已开源。来源:https://mp.weixin.qq.com/s/YCg6FZG2Csz0W1fxvG3eMg
页:
[1]