小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
为什么网络安全对数据科学的重要性比以往任何时候都更高

数据科学与网络安全密切相关,AI系统面临数据中毒和对抗性攻击等新威胁。传统安全措施难以应对,数据科学家需增强安全意识,整合安全文化,采用新防御技术,以保障AI系统的安全性和可靠性。

为什么网络安全对数据科学的重要性比以往任何时候都更高

KDnuggets
KDnuggets · 2025-09-15T14:00:34Z

本文综述了不可学习数据(ULD)作为新兴防御技术,分析了生成方法和评估指标,强调了可学习性、隐匿性、效率与鲁棒性之间的权衡,并指出未来研究方向及其在机器学习数据保护中的潜力。

A Review of Unlearnable Data

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-30T00:00:00Z

本研究探讨了视觉语言模型代理在面对对抗性弹出窗口攻击时的脆弱性,攻击成功率高达86%,导致任务完成率下降47%,表明现有防御技术无效。

Attacking Vision-Language Computer Agents via Pop-ups

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本研究探讨了机器学习在对抗性攻击中的脆弱性,并提出通过防御蒸馏和转移学习等方法增强模型的鲁棒性。研究结果表明,黑盒攻击对深度学习模型的影响显著,因此需要开发有效的防御技术以提高安全性。

模型模仿攻击:可证明可迁移的对抗示例的知识蒸馏

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本研究分析了大型语言模型(LLMs)对越狱提示的脆弱性,评估了多种攻击和防御技术的效果。结果表明,修剪模型参数可以提高抵抗力,某些模型的攻击成功率高达70-100%。研究强调了评估不同破解方法的重要性,并提出了新的基准测试框架,以促进LLM安全性研究的发展。

大型语言模型防御对多轮人类越狱攻击不够稳健

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

本研究分析了大型语言模型(LLMs)的越狱攻击及防御技术,评估了多种攻击和防御方法的有效性。提出了一种利用语意防火墙概念的自动破解监管新方法,并展示了其在不同模型上的成功率。研究强调了评估破解方法的重要性,并提出了安全训练的失败模式,建议将安全机制复杂度与模型能力相匹配。

LLM 对拒绝训练方式的过去时态的推广性研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-16T00:00:00Z

本研究分析了自动说话人验证(ASV)系统对抗欺骗攻击的有效性,提出了一种基于深度神经网络的通用独立式自动说话人验证系统(G-SASV)。实验结果表明,该系统在欺骗检测中表现优异,等错误率显著降低。研究强调了ASV系统与欺骗攻击之间的演变关系,并提出多种防御技术以增强系统的鲁棒性。

应用 ASV 进行语音识别:TTS 模型中 VC 和持续性预测改进的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

本研究深入探讨了多语言越狱攻击,提出了一种新算法以创建数据集,并评估了多种语言模型的防御能力。结果表明,缓解策略将攻击成功率降低了96.2%。研究强调了对大型语言模型的安全性评估和防御技术的重要性,并提供了基准测试框架以推动相关研究。

知识破解:一知识点价值一次攻击

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z

本文综述了点云模型的对抗攻击与防御技术,提出了新的攻击公式和灵敏度映射方法,展示了在合成和真实数据上超过89%的攻击成功率。研究表明,3D点云模型对对抗攻击更脆弱,但也更易防御,并探讨了未来的研究方向和挑战。

Eidos: 高效、微不可见的对抗 3D 点云

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-23T00:00:00Z

本文研究了大型语言模型(LLMs)的安全性,分析了多种破解攻击及防御技术。研究发现LLMs存在关键脆弱性,并提出了自我保护方法和新算法以增强模型的防御能力,显著降低攻击成功率。通过实证研究,深入理解多语言越狱攻击及其缓解策略,为未来研究奠定基础。

SpeechGuard: 多模态大型语言模型的对抗鲁棒性探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-14T00:00:00Z

本文探讨了普适对抗触发器的生成及其在文本分类器中的攻击性能。研究表明,利用对抗正则化自编码器和梯度搜索等技术,可以生成更自然的攻击短语,难以被检测。此外,提出了针对事实核查系统的攻击方法,并验证了其在大型语言模型上的有效性,强调了防御技术的重要性。

通用对抗触发器并非通用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-24T00:00:00Z

本文探讨了大型语言模型(LLMs)在对抗性攻击下的安全性,提出了DRA黑盒越狱方法,成功率高达90%。研究评估了多种攻击与防御技术,并引入环境背景的对抗性游戏(ICAG)以增强防御能力。通过多代理辩论,发现可有效减少模型的有害性,提升抵抗能力。

学会伪装:通过多智能体攻击者 - 伪装者游戏避免 LLM 的拒绝回应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

本文介绍了一种新的防御方法NoisyGNNs,通过在模型架构中引入噪声来提高GNN的鲁棒性。NoisyGNN在节点分类任务上展示了卓越性能,可与不同的GNN架构集成。与现有的防御技术结合使用可以进一步提高对抗性防御效果。

图神经网络的简单而又相对有效的防御方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-21T00:00:00Z

该文章介绍了Web安全的重要性和发展前景,推荐了一份共327页的Web安全学习笔记,适合零基础学员从入门到进阶学习。同时,文章提供了防御技术、认证机制等方面的知识,以及参考链接和工具资源。建议有兴趣的读者收藏该笔记并学习。

327页Web安全学习笔记| 常见Web安全攻防总结!(附PDF)

运维派
运维派 · 2023-10-31T10:04:57Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码