小红花·文摘

代理人工智能安全：防御提示注入和工具滥用

MachineLearningMastery.com ·

ColdFusion开发者的AI安全 - CFSummit 2026幻灯片

Pete Freitag's Homepage ·

设计抗击提示注入的AI代理

OpenAI ·

每个大型语言模型应用面临的三大隐性风险（及其防范措施）

MachineLearningMastery.com ·

持续增强ChatGPT Atlas对提示注入攻击的防护

OpenAI ·

网络安全公司Tenable发现七种新型数据窃取手法，攻击者利用ChatGPT的默认功能进行间接提示注入，诱使其泄露用户隐私。研究表明，ChatGPT的长期记忆和搜索能力存在漏洞，攻击者可通过恶意网站和对话注入实现数据窃取。尽管部分问题已修复，GPT-5仍存在相关风险。

ChatGPT 被诱导自我注入攻击，7 种新型手法窃取隐私数据

FreeBuf网络安全行业门户 ·

理解提示注入：前沿安全挑战

OpenAI ·

研究人员攻破了OpenAI的Guardrails安全护栏，利用提示注入方法绕过安全检测，生成危险内容。攻击者能够同时操控生成模型和安全评估模型，导致系统漏洞。专家警告，依赖模型评估可能造成虚假安全感，建议采用独立验证和持续对抗测试以增强防御。

OpenAI安全护栏破绽百出，简单提示注入即可绕过

FreeBuf网络安全行业门户 ·

OpenAI的新浏览器引发安全隐患，CISO指出“提示注入”问题尚未解决，攻击者可通过普通文本指令进行攻击，AI浏览器可能成为新的安全漏洞，需引起重视。

AI浏览器：安全前沿的挑战

Jim Nielsen’s Blog ·

OpenAI推出的Guardrails安全框架旨在提升AI安全性，但研究显示其存在漏洞，攻击者可通过提示注入绕过安全检测，生成有害内容。这一发现突显了保护AI系统的挑战，专家建议采用独立验证和红队测试以增强防御。

OpenAI安全护栏框架破绽百出，简单提示注入即可绕过

FreeBuf网络安全行业门户 ·

GitHub Copilot Chat存在CVSS评分9.6的高危漏洞，攻击者可利用新型提示注入技术窃取私有仓库的源代码和敏感信息。该漏洞已修复，GitHub禁用了相关图片渲染功能以防止攻击。

GitHub Copilot高危漏洞可导致攻击者窃取私有仓库源代码

FreeBuf网络安全行业门户 ·

网络安全公司Legit Security发现，攻击者可通过拉取请求中的隐藏注释诱使GitHub Copilot泄露私有代码仓库的敏感数据。研究人员Omer Mayraz报告后，GitHub禁用了Copilot Chat中的图像渲染功能以修复该漏洞。此攻击利用了提示注入和CSP绕过技术，揭示了AI工具接入外部工具时的安全风险。