通过对抗性领域对齐进行医学多模态模型窃取攻击

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新的窃取攻击方法——对抗性领域对齐(ADA-STEAL),针对医疗多模态大型语言模型的知识产权脆弱性。该方法通过数据增强和对抗噪声,利用自然图像克服医学图像与自然图像的分布差异,实验表明攻击者可在没有医疗数据的情况下窃取MLLM的功能。

🎯

关键要点

  • 本研究提出了一种新的窃取攻击方法——对抗性领域对齐(ADA-STEAL)。
  • 该方法针对医疗多模态大型语言模型(MLLMs)的知识产权脆弱性。
  • ADA-STEAL利用自然图像,通过数据增强和对抗噪声克服医学图像与自然图像的分布差异。
  • 实验结果表明,攻击者可以在没有医疗数据的情况下窃取MLLM的功能。
➡️

继续阅读