本研究提出了一种新的自监督目标——互信息非对比损失(MINC),旨在解决自监督表征学习中的高方差和大批量需求问题。实验结果表明,MINC在图像表征学习中优于传统对比损失,具有更强的泛化能力和转移性。
本研究提出了一种逆知识蒸馏(IKD)方法,旨在解决对抗攻击算法在目标与源模型间转移性不足的问题。通过引入新损失函数,IKD显著提高了对抗样本在黑箱攻击中的有效性和成功率,实验结果表明IKD有效增强了对抗样本的转移性。
本研究解决了目标转移性仍然具有挑战性的问题,通过提出一种全局与局部相结合的攻击方案,来提升针对特定目标的转移性。该方法对受害者图像进行细分,在每个区域同时进行针对性攻击,从而减少了代理模型与受害者模型之间的注意力不一致所导致的转移失败。实验结果表明,该方法在各类攻击中显著提高了目标转移性,并且在实际应用平台上验证了其优越性。
本研究针对目标攻击的转移性不足问题,提出了一种新方法,通过对微调轨迹进行平均处理,从而提高对抗样本的转移性。实验结果表明,该方法在不同攻击场景中相较于现有微调方案具有显著优势,展现了推动目标攻击性能提升的潜力。
本研究提出ErasableMask方案,解决黑箱人脸识别模型中的面部隐私保护问题。该方案通过新型攻击和擦除机制,增强了对黑箱模型的转移性,成功实现超过72%的转移置信度和90%的擦除成功率,具有重要的隐私保护潜力。
本文研究了大型语言模型(LLMs)面临的越狱攻击及其安全性,提出了多种攻击和防御方法,如PAIR算法、ReNeLLM框架和前缀引导(PG)防御框架。研究表明,现有防御方法存在不足,新技术能够显著提高攻击成功率和模型安全性,为未来研究奠定基础。
本研究探讨跳跃连接在对抗场景中的特性,发现其能够更容易地生成高可转移性的对抗样本。关键的发现是,使用跳跃连接中的更多梯度进行反向传播,能显著提高攻击的可转移性,从而对深度学习模型架构提出了新的挑战与研究方向。
针对稀疏图卷积网络下采样的可转移性问题,本文提出了一种基于稀疏随机图模型的大规模稀疏图下采样方法,该方法支持不同稀疏级别的调整。通过理论推导,研究表明更高的采样率、更大的平均度期望和更小的初始图大小可显著改善下采样的可转移性表现。
本文介绍了DPatch,一种针对现代计算机视觉系统的黑盒攻击方法,通过微小扰动影响目标检测性能。研究发现,即使在物体边界框外添加扰动,也会显著降低检测准确性。研究者通过生成对抗补丁和优化攻击策略,成功误导了YOLOv2等检测器,并提出了有效的防御机制,以增强模型的韧性和可靠性。
该研究针对可转移对抗攻击在边缘计算环境中的高计算成本的挑战,提出了一种新的梯度编辑框架GE-AdvGAN+,集成了多种主流攻击方法以增强可转移性并显著降低资源消耗。实验结果表明,与基线方法相比,该框架在攻击成功率和计算效率上都有显著提升,具有重要的实际应用潜力。
本文研究了影响对抗样本传递性的因素,提出了方差降低攻击等新策略以增强传递性。通过多种实验验证了这些技术在不同模型和数据集上的有效性,显著提高了对抗攻击的成功率。
通过设计防护框架 SOPHON 和精心优化过程,本文介绍了一种新颖的学习范式 —— 非精调学习,可以防止强大的预训练模型被用于不道德或非法任务,同时保持其在原始任务上的性能,旨在进一步推动对安全和负责任的人工智能的研究。
本文研究了预训练语言模型在视觉语言推理任务中的应用,提出了动态视觉提示和多任务视觉语言提示调整等新方法,显著提升了模型的效率和性能。此外,自适应集成方法和视觉提示结合技术在多种任务中表现优异,展现了良好的适应性和泛化能力。
研究者提出了一种新型对抗攻击方法NeRFTAP,通过引入样式一致性损失,提高了生成的对抗性人脸图像的有效性和自然性。实验证明该方法比现有攻击技术更优越,为提高人脸识别系统的稳健性提供了见解。
该研究提出了一种使用生成建模对量子纠错码进行译码的通用框架。该模型利用自回归神经网络,特别是Transformer,学习逻辑运算符和综合症的联合概率。经过预训练后,该模型可以高效计算逻辑运算符的可能性,并直接生成最可能的逻辑运算符。实验结果显示,该方法在译码准确性方面比传统算法提供了显着改进。该框架适用于任何误差模型和量子码拓扑结构,并利用了GPU的并行化能力。
Fair Collapse(FaCe)是一种新方法,通过测量预训练模型中神经崩溃的程度来进行传递性估计。该方法包括方差崩溃项和类公平度项,实验结果表明在不同任务上取得了最先进的性能,证明了该方法的有效性和泛化能力。
该文提出了一种支持数据驱动式增材制造知识转移的方法,通过三步骤的知识可转移性分析框架,能够在不同的增材制造技术之间进行知识转移,为实现高效的跨环境或跨过程知识交流奠定了基础。
本研究提出了一个用于在不同领域中高度转移的攻击框架,通过可生成网络实现领域不变的扰动。该方法在白盒和黑盒情况下均创新了欺骗率的最佳性能,并且优于传统的实例特定攻击方法。
完成下面两步后,将自动完成登录并继续当前操作。