InfoQ ·

DeepMind研究人员提出针对大型语言模型提示注入的防御措施

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

谷歌DeepMind研究人员提出了CaMeL，旨在防止大型语言模型的提示注入攻击。CaMeL通过提取查询的控制和数据流，中和了67%的攻击。该方法结合传统软件安全原则，使用自定义Python解释器跟踪数据来源，确保操作符合权限限制。尽管在AgentDojo基准测试中表现良好，但仍需用户定义安全策略，可能导致用户疲劳。

🎯

关键要点

谷歌DeepMind研究人员提出了CaMeL，旨在防止大型语言模型的提示注入攻击。
CaMeL通过提取查询的控制和数据流，中和了67%的攻击。
攻击者可以向大型语言模型注入恶意数据或指令，导致数据泄露或不当使用工具。
CaMeL结合传统软件安全原则，如控制流完整性和访问控制，来增强安全性。
CaMeL使用自定义Python解释器跟踪数据来源，确保操作符合权限限制。
CaMeL的设计基于双重大型语言模型模式，确保特权模型不接触不可信数据。
研究人员指出，CaMeL的弱点在于攻击者仍可能操纵隔离模型产生误导性输出。
CaMeL生成的程序负责执行所有必要步骤，并构建数据流图以跟踪数据元素的来源和权限。
DeepMind研究人员承认CaMeL并非完美解决方案，用户需定义安全策略可能导致用户疲劳。

❓

延伸问答

CaMeL是什么，它的主要功能是什么？

CaMeL是谷歌DeepMind研究人员提出的一种防御措施，旨在防止大型语言模型的提示注入攻击，能够中和67%的攻击。

CaMeL是如何增强大型语言模型的安全性的？

CaMeL结合传统软件安全原则，如控制流完整性和访问控制，通过提取查询的控制和数据流来增强安全性。

CaMeL在AgentDojo基准测试中的表现如何？

在AgentDojo基准测试中，CaMeL表现良好，能够有效中和大部分提示注入攻击。

CaMeL的设计中有哪些关键技术？

CaMeL使用自定义Python解释器跟踪数据来源，并生成程序以确保操作符合权限限制。

CaMeL的主要局限性是什么？

CaMeL的主要局限性在于依赖用户定义安全策略，可能导致用户疲劳和不当批准。

提示注入攻击对大型语言模型的影响是什么？

提示注入攻击可能导致数据泄露或不当使用工具，影响模型的安全性和可靠性。

🏷️

继续阅读

研究：世界杯期间球迷最担心的技术难题
英国球迷正准备迎接夏季足球盛宴，深夜比赛将改变观赛方式。研究显示，80%球迷认为比赛时间影响观看直播，许多人计划调整观赛习惯。82%球迷希望第一时间看到进...
英国通信管理局（Ofcom）制定人工智能战略，相关研究正在进行中
英国通信管理局（Ofcom）发布了更新的人工智能战略，旨在支持通信行业采用人工智能并应对消费者风险。该战略强调技术中立和结果导向，推动创新并确保安全，包括...
论独立游戏的起步立项方法论
在当下这个互联网时代做独立游戏，是幸运的，得益于各路大佬的经验分享，诸如引擎选择、外包渠道、素材获取，编程整合 […]
技嘉在COMPUTEX 2026展示多款生活美学主机
(全球TMT2026年6月5日讯)技嘉科技于COMPUTEX 2026展示多款生活美学主机，包含展现简约风格的 […]
技嘉于COMPUTEX 2026以“ENTER INFINITY”为主题开展
(全球TMT2026年6月5日讯)技嘉科技正式于COMPUTEX 2026以“ENTER INFINITY”为 […]
华为云发布Agentic AI系列新品打造智能时代“硅基黑土地”
华为云在上海INSPIRE大会上发布了Agentic Infra新范式及多款Agentic AI产品，旨在推动企业智能化转型。大会还推出“行业AI梦工厂”...