上海多校及AI Lab联合发布RiOSWorld,揭秘Computer-Use Agent安全漏洞风险

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
由上海 AI Lab、中国科学技术大学和上海交通大学联合开发的 RiOSWorld 是一个用于评估多模态 Computer-Use Agent(CUA)安全风险的全面测试基准。该基准包含 492 个真实环境下的测试案例,覆盖钓鱼网站、恶意邮件、reCAPTCHA 绕过及用户诱导性风险等 13 类风险场景。研究结果显示,GPT-4.1、Claude-3.7-Sonnet 等主流 CUA 平均有 84.93% 的概率有意执行风险行为,其中 59.64% 的情况会完成风险目标;在部分高风险场景中,Agent 的失败率甚至突破 89%。这表明当前 CUA 在安全性方面仍存在严重缺陷,亟需改进。相关成果已开源。
来源:https://mp.weixin.qq.com/s/YCg6FZG2Csz0W1fxvG3eMg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-7-5 21:51 , Processed in 0.288030 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表