基于多智能体强化学习的分布式黑盒模型逆推攻击

原文约300字，阅读约需1分钟。发表于：。

基于生成对抗网络的模型逆向攻击旨在通过在潜在空间中搜索代码来从复杂深度学习模型中恢复私有训练数据。本文提出了一种新颖的分布式黑盒模型逆向攻击方法，通过构建概率潜在空间来搜索目标隐私数据，相比现有方案具有更好的攻击准确性和性能。

本文介绍了一种名为CG-MI的置信度引导模型反演攻击方法，利用预训练的GAN的潜在空间和无梯度优化器，在不同数据分布的黑盒设置中实现了高分辨率的模型反演攻击。该方法在Celeba和Facescrub的不同分布设置中，比SOTA黑盒MIA的攻击效果提高了超过49％和58％。此外，该方法能够生成与白盒攻击产生的高质量图像相当的图像。该方法为黑盒模型反演攻击提供了实用而有效的解决方案。