视觉语言模型易受攻击?西安交大等提出基于扩散模型的对抗样本生成新方法

[复制链接]
周大 发表于 2024-12-28 18:32:10 | 显示全部楼层 |阅读模式
西安交通大学等机构提出AdvDiffVLM,针对大型视觉语言模型(VLMs)的高效对抗样本生成方法。该方法通过扩散模型和得分匹配,结合自适应集成梯度估计(AEGE)及GradCAM引导的掩模生成(GCMG),解决了现有方法成本高、迁移性低的问题。实验表明,与基准方法相比,AdvDiffVLM生成对抗样本的速度提高了5至10倍,同时保持了更高的迁移性和图像质量,成功攻击包括GPT-4V在内的多种商用VLM。
来源:https://mp.weixin.qq.com/s/1-H5yKXNm8S_S-1Pw6zQMg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-22 08:34 , Processed in 0.286500 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表