通过对抗性领域对齐进行医学多模态模型窃取攻击
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新的窃取攻击方法——对抗性领域对齐(ADA-STEAL),针对医疗多模态大型语言模型的知识产权脆弱性。该方法通过数据增强和对抗噪声,利用自然图像克服医学图像与自然图像的分布差异,实验表明攻击者可在没有医疗数据的情况下窃取MLLM的功能。
🎯
关键要点
- 本研究提出了一种新的窃取攻击方法——对抗性领域对齐(ADA-STEAL)。
- 该方法针对医疗多模态大型语言模型(MLLMs)的知识产权脆弱性。
- ADA-STEAL利用自然图像,通过数据增强和对抗噪声克服医学图像与自然图像的分布差异。
- 实验结果表明,攻击者可以在没有医疗数据的情况下窃取MLLM的功能。
➡️