随机平滑是一种增强机器学习模型鲁棒性的方法,但攻击者可以利用其随机性进行后门攻击。本文提出两种攻击方式:简单攻击通过替换噪声分布,位翻转攻击则通过微调随机数生成器的位数,导致预测置信度严重失真。这表明现有防御措施无法有效应对复杂攻击,需加强对随机性来源的信任与防护。
本研究提出了一种随机平滑理论,用于在不可微函数中进行梯度估计。该方法无需可微密度或完整支持,提供了通用框架,有效减少梯度估计的方差。
本文分析了平均认证半径(ACR)在随机平滑方法评估中的不足,指出其对简单样本过于敏感,可能导致偏差。研究表明,提高ACR可能削弱复杂样本的稳健性,强调需要更有效的指标来全面评估随机平滑效果。
本研究探讨了随机平滑技术在提高分类器对抗扰动鲁棒性方面的有效性。通过理论分析和实验证明,随机平滑能够增强分类器的认证准确率,尤其在处理对抗性噪声时表现优越。研究还提出了改进的训练方法和认证策略,以应对维度诅咒和成本敏感场景,显示出显著的鲁棒性提升。
本文介绍了提高机器学习模型对抗性鲁棒性的方法,包括CITRUS、Text-CRS和APT等。这些方法利用随机平滑、上下文增强和对比学习等技术,显著提升了模型在噪声输入和对抗攻击下的准确性和鲁棒性,展示了在自然语言处理和文本生成任务中的应用潜力。
本文提出了一种名为“双重采样随机平滑框架(DSRS)”的方法,以提高神经网络的鲁棒性。研究表明,DSRS能够有效应对高维数据集中的“维数诅咒”,并在CIFAR-10和ImageNet数据集上显著提升准确性和鲁棒性。通过新的训练噪声分布和正则化方案,改善了对不同扰动的认证鲁棒性。
深度学习恶意软件检测器易受对抗性样本攻击。为此,提出了一种基于随机平滑的防御方案,通过选择相关字节子集降低对抗性内容的采样概率。研究表明,基于块的平滑分类器在应对最新规避攻击时表现出更高的韧性,优于非平滑分类器。
本文提出了一种双重采样随机平滑框架(DSRS),旨在提高神经网络模型的鲁棒性,克服高维数据集中的“维数诅咒”。实验结果表明,DSRS在多种情况下能够实现更大的鲁棒半径,并通过新的训练噪声分布和正则化方案,增强了对扰动边界的认证鲁棒性。
该研究证明了在低维投影空间中执行随机平滑可以确定高维输入空间中平滑复合分类器的认证区域的可行下界,并在 CIFAR-10 和 SVHN 上进行了实验证明。该研究比较了认证区域的体积与各种基准,并证明了该方法在数量级上优于现有技术。
完成下面两步后,将自动完成登录并继续当前操作。