小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

文章讨论了大语言模型(LLMs)在应对对抗性扰动时的缺陷,强调在金融、法律和医疗等关键领域部署时需要更强的防御机制。评论者建议研究应包括人类的比较,以验证模型的推理能力。尽管人类和LLMs在处理信息时存在相似之处,但LLMs的表现仍需改进,以避免被无关信息分散注意力。

用猫干扰推理大模型:面向推理模型的查询无关对抗触发方法

程序师
程序师 · 2025-07-30T13:58:28Z

本研究提出LipsLev方法,旨在提高文本分类器在对抗性扰动下的鲁棒性。该方法计算卷积分类器的Lipschitz常数,在AG-News数据集上实现了38.80%的验证准确率,并提升了速度达4个数量级。

基于有界莱文斯坦距离的认证鲁棒性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本研究提出了一种新方法,通过将生成建模任务转化为潜在空间中的分类任务,增强深度神经网络在对抗性扰动下的鲁棒性。实验结果显示,该模型在多个数据集上表现优异,尤其在大扰动情况下,验证准确度提高了5.3%。

Robust Representation Consistency Model through Contrastive Denoising

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-22T00:00:00Z

本研究通过知识蒸馏的转移攻击方法,减少神经网络对抗性扰动的查询次数。在有限蒸馏迭代内,证明攻击成功有理论保障,尤其是学生模型学习能力强时。这为对抗攻击提供了新的理论基础。

模型模仿攻击:可证明可迁移的对抗示例的知识蒸馏

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本文研究了对现代大型语言模型(LLMs)在编码任务中的对抗性示例攻击的影响,并提出了基于提示的防御措施,实验证明其具有改善模型韧性的潜力。

TF-攻击:对大语言模型的可转移快速对抗攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-26T00:00:00Z

本文研究使用深度神经网络对广播领域信号处理算法进行分类,并探究对抗性扰动对DNN分类器的欺骗和准确度降低的效果及来源。

无线信号分类中对抗样本的对策

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z

本论文分析了深层网络对对抗性扰动的不稳定性,并提出了一个分析分类器鲁棒性的理论框架。研究结果显示,选定的分类器在小区分能力任务中对对抗性扰动不具备鲁棒性。

揭秘神经网络的对抗脆弱性之路

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-23T00:00:00Z

该研究提出了一种名为FMR-GC的创新插拔模块,用于提高深度神经网络对对抗性扰动的鲁棒性。该模块通过谐调特征图以重构图,并采用图卷积捕获邻域信息,有效校准污染特征。结合先进的对抗训练方法,该模块能显著提高鲁棒性而不影响准确性。

特征映射协调:增强对抗鲁棒性的图卷积方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z

本文研究了对大型语言模型(LLMs)的编码任务的对抗性扰动的影响,并提出了基于提示的防御措施。实验证明,对抗性示例具有可转移性,削弱了LLMs的性能。提出的防御措施显示出改善模型韧性的潜力。

评估大型语言模型安全性的因果分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码