本文探讨了机器学习中的对抗性样本检测,提出了统计检验和模型增强方法,强调统计特性的重要性。研究分析了对抗性攻击及防御策略,评估了不同神经网络在工业故障诊断中的脆弱性,并提出结合多种防御方法以提高安全性。
本文介绍了对抗性样本攻击的多种方法,包括改进型PGD和C&W方法,强调了友好对抗训练(FAT)和稀疏对抗扰动的有效性。研究表明,这些方法在MNIST和CIFAR-10数据集上表现优异,能有效提高模型的鲁棒性,降低训练成本。
该研究探讨了对抗性样本及训练,提出多样化训练和集成方法以提高深度学习模型的鲁棒性。通过随机化分类器和噪声注入等技术,显著增强了模型对抗攻击的抵抗力,并在多个数据集上取得了优异表现。
本研究探讨了非极大值抑制(NMS)在目标检测中的应用,提出了多种改进方法,如Soft-NMS和基于分组的可微分NMS,显著提高了检测精度和效率。同时,研究分析了对抗性样本攻击对检测系统的影响,并提出基于置信传播聚类的检测方法,以提升检测框的准确性。
本研究探讨了深度神经网络输入空间的模式连通性,发现具有相似预测的不同输入图像之间存在连通性,揭示了优化算法收敛过程的内在规律,并提供了对抗性样本的新见解。
本文探讨了神经网络在处理超出训练数据分布的样本时的表现,提出了多种新方法来检测分布外和对抗性样本。这些方法在视觉分类和语音命令检测任务中优于传统技术,显著提高了检测准确性,并在多个基准测试中取得最佳结果。
本研究提出了一种新型面部反欺诈方法,利用CNN-RNN模型学习面部深度和估计rPPG信号,以识别真实与虚假人脸。通过多种技术改进检测性能,并提出AdvFAS框架以应对对抗性样本,实验结果表明其在准确性和鲁棒性方面优于传统方法。
本文探讨了黑盒图像分类中的对抗性样本问题,提出了一种基于偏差抽样的新方法,显著提高了攻击效率。同时,研究利用Shapley值检测正常与对抗输入,展示了高准确性和强泛化能力。此外,提出了新技术以隐藏分类器偏见,并讨论了可解释人工智能中的安全性问题,强调了持续评估的重要性。
本文介绍了一种新型损失函数,用于生成对抗性样本,以提高卷积神经网络在恶意软件检测中的鲁棒性。研究探讨了对抗样本的构建及其对模型安全性的影响,并提出了基于随机平滑的防御方案,显示出较高的鲁棒性和泛化能力。
本文探讨了大型语言模型(LLMs)的安全性和脆弱性,发现LLMs能够生成对抗性样本,影响仇恨言论检测等系统。提出了基于异常检测的防御框架和LLAMOS技术,以增强模型的鲁棒性。此外,研究指出对抗攻击对教育领域剽窃检测工具的挑战,并提出新范式以确保公平评估。
本文提出双重关注抑制攻击(DAS),旨在对抗深度学习模型中的物理对抗性样本,实验结果显示其优于现有方法。研究探讨了深度神经网络与人类视觉感知的关系,并提出基于双过程结构的人工智能架构以解决安全性问题。同时,总结了对抗攻击技术及防御策略,强调深度学习模型的鲁棒性和可解释性。
本研究提出了一种反事实数据增强方法,旨在提高机器学习模型的泛化能力和鲁棒性。通过生成对抗性反事实样本,消除误导特征,解决专家数据稀缺和环境变化问题。实验结果表明,该方法在多种学习场景中显著优于传统模型,提升了模型的预测能力和性能。
本文提出了一种基于强化学习的对抗性样本生成方法,成功欺骗IMDB情感分类和AG新闻分类模型,同时保持文本语义。研究还探讨了多语言分类器的对抗性攻击,提出了ParaphraseSampler样本采样技术,显示出更高的攻击成功率。此外,分析了神经机器翻译系统的缺陷,并提出了改进对抗样本质量的R&R框架,显著提高了攻击成功率。
深度学习恶意软件检测器易受对抗性样本攻击。为此,提出了一种基于随机平滑的防御方案,通过选择相关字节子集降低对抗性内容的采样概率。研究表明,基于块的平滑分类器在应对最新规避攻击时表现出更高的韧性,优于非平滑分类器。
本文研究了对抗性样本对深度学习模型的影响,特别是在医疗领域的显著攻击效果。提出了毒化数据集ImageNet-P,强调了对抗样本的安全性和鲁棒性问题,建议医疗机构在部署深度学习系统时注意潜在漏洞,并推动相关研究。
通过RL的有针对性改写方法,使用FLAN T5作为生成器,通过近端策略梯度自动学习生成对抗性样本,改善模型性能。实验证明其在发现自然对抗性攻击和提高模型性能方面有效,优于强基准线,具有普适性。结合语言建模和强化学习的优势生成多样且有影响力的对抗性样本。
研究人员提出了一种名为Instruct2Attack(I2A)的基于语言引导的语义攻击方法,利用潜态扩散模型生成对抗性潜态编码,生成更自然和多样的对抗性样本。通过GPT-4自动化攻击过程,生成多样的图像特定文本指令。研究表明,I2A能够成功破解深度神经网络,并具有强大的迁移能力。
本文通过强化学习生成对抗性样本,探究了神经机器翻译系统的失败情况,并对两种主流架构进行了敌对攻击实验。结果显示该方法能有效生成稳定的攻击和有保留含义的对抗性样本,并展示了攻击偏好模式的定性和定量分析,证明了该方法能暴露系统的缺陷。
提出了一种针对长尾分布数据集的对抗训练框架——REAT,通过惩罚函数生成平衡和有信息的对抗性样本,提高模型鲁棒性和准确性。经过评估证明REAT有效。
研究提出了一种新型生成模型,可以制造出近似自然图像的对抗性样本,欺骗之前训练好的模型。扰动成功率高,规模小,比当前迭代方法更快。
完成下面两步后,将自动完成登录并继续当前操作。