小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文探讨了机器学习中的对抗性样本检测,提出了统计检验和模型增强方法,强调统计特性的重要性。研究分析了对抗性攻击及防御策略,评估了不同神经网络在工业故障诊断中的脆弱性,并提出结合多种防御方法以提高安全性。

使用变分自编码器生成商业流程的真实对抗样本

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

本文介绍了对抗性样本攻击的多种方法,包括改进型PGD和C&W方法,强调了友好对抗训练(FAT)和稀疏对抗扰动的有效性。研究表明,这些方法在MNIST和CIFAR-10数据集上表现优异,能有效提高模型的鲁棒性,降低训练成本。

低秩对抗PGD攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

该研究探讨了对抗性样本及训练,提出多样化训练和集成方法以提高深度学习模型的鲁棒性。通过随机化分类器和噪声注入等技术,显著增强了模型对抗攻击的抵抗力,并在多个数据集上取得了优异表现。

LOTOS:用于训练强健集成的逐层正交化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本研究探讨了非极大值抑制(NMS)在目标检测中的应用,提出了多种改进方法,如Soft-NMS和基于分组的可微分NMS,显著提高了检测精度和效率。同时,研究分析了对抗性样本攻击对检测系统的影响,并提出基于置信传播聚类的检测方法,以提升检测框的准确性。

加速非极大值抑制:图论视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

本研究探讨了深度神经网络输入空间的模式连通性,发现具有相似预测的不同输入图像之间存在连通性,揭示了优化算法收敛过程的内在规律,并提供了对抗性样本的新见解。

深度神经网络中的输入空间模式连通性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

本文探讨了神经网络在处理超出训练数据分布的样本时的表现,提出了多种新方法来检测分布外和对抗性样本。这些方法在视觉分类和语音命令检测任务中优于传统技术,显著提高了检测准确性,并在多个基准测试中取得最佳结果。

层次视觉类别建模:联合表示学习与密度估计框架用于分布外检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-28T00:00:00Z

本研究提出了一种新型面部反欺诈方法,利用CNN-RNN模型学习面部深度和估计rPPG信号,以识别真实与虚假人脸。通过多种技术改进检测性能,并提出AdvFAS框架以应对对抗性样本,实验结果表明其在准确性和鲁棒性方面优于传统方法。

时间感知人脸防伪技术:使用旋转不变局部二值模式与深度学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

本文探讨了黑盒图像分类中的对抗性样本问题,提出了一种基于偏差抽样的新方法,显著提高了攻击效率。同时,研究利用Shapley值检测正常与对抗输入,展示了高准确性和强泛化能力。此外,提出了新技术以隐藏分类器偏见,并讨论了可解释人工智能中的安全性问题,强调了持续评估的重要性。

使用输出洗牌攻击欺骗SHAP

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-12T00:00:00Z

本文介绍了一种新型损失函数,用于生成对抗性样本,以提高卷积神经网络在恶意软件检测中的鲁棒性。研究探讨了对抗样本的构建及其对模型安全性的影响,并提出了基于随机平滑的防御方案,显示出较高的鲁棒性和泛化能力。

恶意软件检测器对抗样本的鲁棒性研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-05T00:00:00Z

本文探讨了大型语言模型(LLMs)的安全性和脆弱性,发现LLMs能够生成对抗性样本,影响仇恨言论检测等系统。提出了基于异常检测的防御框架和LLAMOS技术,以增强模型的鲁棒性。此外,研究指出对抗攻击对教育领域剽窃检测工具的挑战,并提出新范式以确保公平评估。

对大规模语言模型的对抗欺骗攻击效率

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-12T00:00:00Z

本文提出双重关注抑制攻击(DAS),旨在对抗深度学习模型中的物理对抗性样本,实验结果显示其优于现有方法。研究探讨了深度神经网络与人类视觉感知的关系,并提出基于双过程结构的人工智能架构以解决安全性问题。同时,总结了对抗攻击技术及防御策略,强调深度学习模型的鲁棒性和可解释性。

深度学习模型的双重思维与感知分析使用人类对抗性示例

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-11T00:00:00Z

本研究提出了一种反事实数据增强方法,旨在提高机器学习模型的泛化能力和鲁棒性。通过生成对抗性反事实样本,消除误导特征,解决专家数据稀缺和环境变化问题。实验结果表明,该方法在多种学习场景中显著优于传统模型,提升了模型的预测能力和性能。

因果作用感知的反事实数据增强

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-29T00:00:00Z

本文提出了一种基于强化学习的对抗性样本生成方法,成功欺骗IMDB情感分类和AG新闻分类模型,同时保持文本语义。研究还探讨了多语言分类器的对抗性攻击,提出了ParaphraseSampler样本采样技术,显示出更高的攻击成功率。此外,分析了神经机器翻译系统的缺陷,并提出了改进对抗样本质量的R&R框架,显著提高了攻击成功率。

文本分类器的对抗攻击的约束执行奖励

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-20T00:00:00Z

深度学习恶意软件检测器易受对抗性样本攻击。为此,提出了一种基于随机平滑的防御方案,通过选择相关字节子集降低对抗性内容的采样概率。研究表明,基于块的平滑分类器在应对最新规避攻击时表现出更高的韧性,优于非平滑分类器。

基于机器学习的恶意软件检测器的认证对抗鲁棒性:(去) 随机平滑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-01T00:00:00Z

本文研究了对抗性样本对深度学习模型的影响,特别是在医疗领域的显著攻击效果。提出了毒化数据集ImageNet-P,强调了对抗样本的安全性和鲁棒性问题,建议医疗机构在部署深度学习系统时注意潜在漏洞,并推动相关研究。

DataCook:用于医疗数据版权保护的反对抗示例编写

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-26T00:00:00Z

通过RL的有针对性改写方法,使用FLAN T5作为生成器,通过近端策略梯度自动学习生成对抗性样本,改善模型性能。实验证明其在发现自然对抗性攻击和提高模型性能方面有效,优于强基准线,具有普适性。结合语言建模和强化学习的优势生成多样且有影响力的对抗性样本。

在敌对的草堆中寻找针头:一种针对性改写的方法,揭示最小分布畸变的边缘情况

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-21T00:00:00Z

研究人员提出了一种名为Instruct2Attack(I2A)的基于语言引导的语义攻击方法,利用潜态扩散模型生成对抗性潜态编码,生成更自然和多样的对抗性样本。通过GPT-4自动化攻击过程,生成多样的图像特定文本指令。研究表明,I2A能够成功破解深度神经网络,并具有强大的迁移能力。

Instruct2Attack: 语言引导的语义对抗攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-27T00:00:00Z

本文通过强化学习生成对抗性样本,探究了神经机器翻译系统的失败情况,并对两种主流架构进行了敌对攻击实验。结果显示该方法能有效生成稳定的攻击和有保留含义的对抗性样本,并展示了攻击偏好模式的定性和定量分析,证明了该方法能暴露系统的缺陷。

对奖励机器强化学习的对抗性攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-15T00:00:00Z

提出了一种针对长尾分布数据集的对抗训练框架——REAT,通过惩罚函数生成平衡和有信息的对抗性样本,提高模型鲁棒性和准确性。经过评估证明REAT有效。

平衡、不平衡与再平衡:从极小极大博弈角度理解鲁棒过拟合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-30T00:00:00Z

研究提出了一种新型生成模型,可以制造出近似自然图像的对抗性样本,欺骗之前训练好的模型。扰动成功率高,规模小,比当前迭代方法更快。

IMPRESS: 评估扩散式生成人工智能中不可察觉扰动对未经授权的数据使用的韧性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-30T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码