小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文探讨了机器学习中的对抗性样本检测,提出了统计检验和模型增强方法,强调统计特性的重要性。研究分析了对抗性攻击及防御策略,评估了不同神经网络在工业故障诊断中的脆弱性,并提出结合多种防御方法以提高安全性。

使用变分自编码器生成商业流程的真实对抗样本

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

本文介绍了对抗性样本攻击的多种方法,包括改进型PGD和C&W方法,强调了友好对抗训练(FAT)和稀疏对抗扰动的有效性。研究表明,这些方法在MNIST和CIFAR-10数据集上表现优异,能有效提高模型的鲁棒性,降低训练成本。

低秩对抗PGD攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

该研究探讨了对抗性样本及训练,提出多样化训练和集成方法以提高深度学习模型的鲁棒性。通过随机化分类器和噪声注入等技术,显著增强了模型对抗攻击的抵抗力,并在多个数据集上取得了优异表现。

LOTOS:用于训练强健集成的逐层正交化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本研究探讨了非极大值抑制(NMS)在目标检测中的应用,提出了多种改进方法,如Soft-NMS和基于分组的可微分NMS,显著提高了检测精度和效率。同时,研究分析了对抗性样本攻击对检测系统的影响,并提出基于置信传播聚类的检测方法,以提升检测框的准确性。

加速非极大值抑制:图论视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

本研究探讨了深度神经网络输入空间的模式连通性,发现具有相似预测的不同输入图像之间存在连通性,揭示了优化算法收敛过程的内在规律,并提供了对抗性样本的新见解。

深度神经网络中的输入空间模式连通性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

该论文介绍了GenAttack,一种黑盒对抗攻击优化技术,通过遗传算法生成对抗性样本并攻击图像识别模型。该方法查询量少且能攻击对抗性训练的防御措施,证明了遗传算法在黑盒攻击研究中的可行性和前景。

约束性自适应攻击:针对表格数据深度神经网络的有效对抗性攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-02T00:00:00Z

研究了机器学习算法的对抗性攻击,发现对抗性样本的嵌入维度与模型输入样本具有相同嵌入维度时的有效性之间存在很强的相关性,并设计了一种对抗性防御机制。通过使用各种固有维度的集成模型来阻止攻击,在多个数据集上测试了其有效性。同时,还研究了使用不同距离度量来衡量对抗性扰动的问题。

文本分类器中的对抗攻击与维度

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

通过RL的有针对性改写方法,使用FLAN T5作为生成器,通过近端策略梯度自动学习生成对抗性样本,改善模型性能。实验证明其在发现自然对抗性攻击和提高模型性能方面有效,优于强基准线,具有普适性。结合语言建模和强化学习的优势生成多样且有影响力的对抗性样本。

在敌对的草堆中寻找针头:一种针对性改写的方法,揭示最小分布畸变的边缘情况

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-21T00:00:00Z

研究人员提出了一种名为Instruct2Attack(I2A)的基于语言引导的语义攻击方法,利用潜态扩散模型生成对抗性潜态编码,生成更自然和多样的对抗性样本。通过GPT-4自动化攻击过程,生成多样的图像特定文本指令。研究表明,I2A能够成功破解深度神经网络,并具有强大的迁移能力。

Instruct2Attack: 语言引导的语义对抗攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-27T00:00:00Z

本文通过强化学习生成对抗性样本,探究了神经机器翻译系统的失败情况,并对两种主流架构进行了敌对攻击实验。结果显示该方法能有效生成稳定的攻击和有保留含义的对抗性样本,并展示了攻击偏好模式的定性和定量分析,证明了该方法能暴露系统的缺陷。

对奖励机器强化学习的对抗性攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-15T00:00:00Z

提出了一种针对长尾分布数据集的对抗训练框架——REAT,通过惩罚函数生成平衡和有信息的对抗性样本,提高模型鲁棒性和准确性。经过评估证明REAT有效。

平衡、不平衡与再平衡:从极小极大博弈角度理解鲁棒过拟合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-30T00:00:00Z

研究提出了一种新型生成模型,可以制造出近似自然图像的对抗性样本,欺骗之前训练好的模型。扰动成功率高,规模小,比当前迭代方法更快。

IMPRESS: 评估扩散式生成人工智能中不可察觉扰动对未经授权的数据使用的韧性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-30T00:00:00Z

该文介绍了一种自我监督、计算成本低的方法,用于在未知黑盒设置中生成对抗性样本。该方法在攻击训练模型时与最先进方法相当有效,在攻击未知模型时则显著更有效。

OMG-ATTACK:自监督的流形上生成可传递的回避攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-05T00:00:00Z

本研究提出了一种基于敏感度不一致性的检测器(SID),可检测小扰动水平下的对抗性样本。SID在AE检测性能和泛化能力方面优于其他算法。

深度神经网络的图像边界上的不可察觉对抗攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-29T00:00:00Z

本文通过强化学习生成对抗性样本,研究了神经机器翻译系统的失败情况,对RNN-search和Transformer进行了敌对攻击实验,结果表明该方法能够有效生成稳定的攻击和有保留含义的对抗性样本,并展示了攻击偏好模式的定性和定量分析,证明了该方法能够暴露神经翻译系统的缺陷。

LEAP: 自然语言处理软件的高效自动化测试方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-22T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码