攻击成功率从3%到接近100%,利用空格键可绕过Meta AI模型安全系统

[复制链接]
周大 发表于 2024-7-31 15:17:07 | 显示全部楼层 |阅读模式
Meta发布的新AI模型Prompt-Guard-86M意在防范提示词注入和越狱,但被发现存在重大漏洞。通过在字母间插入空格并移除标点符号,用户可轻易绕过安全检测,使模型忽视原有指令。这一绕过方法的成功率高达100%。
来源:https://tech.ifeng.com/c/8bf5qldkb9r

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 22:20 , Processed in 0.345772 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表