破解大模型隐私防线,华科清华联手实现微调数据90%精准识别
华中科技大学与清华大学联合研究团队提出了一种新的成员推理攻击算法SPV-MIA,专门针对微调大型语言模型。该算法通过自提示方法生成高质量校正数据集,并引入概率波动指标来评估成员推理分数,首次将攻击准确度提升至90%以上。实验表明,SPV-MIA仅需1000次查询即可实现高精度攻击,在多种开源大模型上的表现均优于现有方法。这一成果揭示了微调大模型可能存在严重的数据隐私泄露风险,为未来相关研究提供了重要参考。来源:https://mp.weixin.qq.com/s/-SLaL-0q9vhGCnl8Zxn-5Q
页:
[1]