小红花·文摘

本研究探讨了大语言模型水印在知识蒸馏中的鲁棒性，提出了两种水印移除方法并验证其有效性，强调了加强对抗性防御策略的必要性。

Can Watermarking in Large Language Models Effectively Prevent Unauthorized Knowledge Distillation?

BriefGPT - AI 论文速递 ·

本研究提出了一种名为ADD的对抗性防御框架，旨在增强基于机器学习的Android恶意软件检测系统的安全性，以抵御对抗性攻击并提升实际杀毒解决方案的防御能力。

针对基于机器学习的android恶意软件检测系统的对抗性恶意软件攻击的防御

BriefGPT - AI 论文速递 ·

本文探讨了多任务学习在深度神经网络中的应用，提升了对图片失真的鲁棒性。研究表明，提取灵长类视觉皮层的归纳偏见使神经网络更接近人类视觉系统，改善了效率。同时，综述了神经网络模型的概念、建模方法及其在视觉神经科学中的应用，强调了泛化问题及对抗性防御的挑战。

深度学习对增强和语义新颖视觉刺激的人脑反应预测的泛化性分析

BriefGPT - AI 论文速递 ·

本研究探讨了黑盒后门攻击的实施可能性，攻击者可以在不知模型结构的情况下，通过设计后门触发器进行攻击。实验结果表明，该方法在黑盒场景中的成功率高，并能有效规避现有防御措施。此外，研究提出了一种基于知识蒸馏的去偏差框架，能够有效降低模型的偏差和安全风险，强调了对抗性防御机制的重要性。

本文提出了一种新的红外物理攻击方法Adversarial Infrared Geometry (AdvIG)，通过建模几何形状并优化参数，实现高效黑盒攻击。实验结果显示，AdvIG在数字和物理攻击中均表现出高效性和隐蔽性。此外，研究还提出了Adversarial Infrared Curves (AdvIC)，成功率分别为94.8%和67.2%。研究探讨了对抗性防御策略，强调其在现实应用中的安全意义。

多视角黑盒物理攻击对红外行人检测器的影响

BriefGPT - AI 论文速递 ·

Can Watermarking in Large Language Models Effectively Prevent Unauthorized Knowledge Distillation?

针对基于机器学习的android恶意软件检测系统的对抗性恶意软件攻击的防御

深度学习对增强和语义新颖视觉刺激的人脑反应预测的泛化性分析

可撤销的深度模型交易的后门

多视角黑盒物理攻击对红外行人检测器的影响