本研究探讨了大语言模型水印在知识蒸馏中的鲁棒性,提出了两种水印移除方法并验证其有效性,强调了加强对抗性防御策略的必要性。
本研究提出了一种名为ADD的对抗性防御框架,旨在增强基于机器学习的Android恶意软件检测系统的安全性,以抵御对抗性攻击并提升实际杀毒解决方案的防御能力。
本文探讨了多任务学习在深度神经网络中的应用,提升了对图片失真的鲁棒性。研究表明,提取灵长类视觉皮层的归纳偏见使神经网络更接近人类视觉系统,改善了效率。同时,综述了神经网络模型的概念、建模方法及其在视觉神经科学中的应用,强调了泛化问题及对抗性防御的挑战。
本研究探讨了黑盒后门攻击的实施可能性,攻击者可以在不知模型结构的情况下,通过设计后门触发器进行攻击。实验结果表明,该方法在黑盒场景中的成功率高,并能有效规避现有防御措施。此外,研究提出了一种基于知识蒸馏的去偏差框架,能够有效降低模型的偏差和安全风险,强调了对抗性防御机制的重要性。
本文提出了一种新的红外物理攻击方法Adversarial Infrared Geometry (AdvIG),通过建模几何形状并优化参数,实现高效黑盒攻击。实验结果显示,AdvIG在数字和物理攻击中均表现出高效性和隐蔽性。此外,研究还提出了Adversarial Infrared Curves (AdvIC),成功率分别为94.8%和67.2%。研究探讨了对抗性防御策略,强调其在现实应用中的安全意义。
完成下面两步后,将自动完成登录并继续当前操作。