FreeBuf网络安全行业门户 ·

AI大模型安全之提示词注入攻击（Prompt Injection Attack)

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

Prompt Injection Attack是一种针对大模型的攻击方式，通过用户输入绕过系统防护，导致不当操作。攻击分为直接和间接，可能导致数据泄露和恶意程序生成。防范措施包括确保训练数据清洁、实施最小特权原则，以及增加人工审核和过滤机制。

🎯

关键要点

Prompt Injection Attack是一种针对大模型的攻击方式，通过用户输入绕过系统防护。
攻击分为直接和间接，可能导致数据泄露和恶意程序生成。
Prompt是用户输入的提示，用于调整大模型的行为。
Prompt Injection Attack在OWASP大模型安全漏洞排名中位居首位。
攻击利用了大模型系统中指令和输入之间模糊的关系。
Direct Prompt Injection Attack是攻击者直接插入提示，绕过防卫。
Indirect Prompt Injection Attack通过污染的数据源影响模型输出。
Prompt Injection Attack可能导致系统编写恶意程序、错误答案和数据泄露。
防范措施包括确保训练数据清洁、实施最小特权原则和增加人工审核。
开发检测工具以确保API调用合法，防止多余操作。

❓

延伸问答

什么是Prompt Injection Attack？

Prompt Injection Attack是一种针对大模型的攻击方式，通过用户输入绕过系统防护，导致不当操作。

Prompt Injection Attack有哪些类型？

Prompt Injection Attack分为直接和间接两种类型，直接攻击是攻击者直接插入提示，间接攻击则通过污染的数据源影响模型输出。

Prompt Injection Attack可能导致哪些后果？

可能导致系统编写恶意程序、给出错误答案和数据泄露等严重后果。

如何防范Prompt Injection Attack？

防范措施包括确保训练数据清洁、实施最小特权原则，以及增加人工审核和过滤机制。

为什么大模型系统容易受到Prompt Injection Attack？

因为在大模型系统中，指令和输入之间的关系模糊，用户可以通过输入的指令来训练系统，导致界限不清。

Prompt在大模型中有什么作用？

Prompt是用户输入的提示，用于调整大模型的行为，影响模型的输出结果。

🏷️

继续阅读

AI真能搞钱了！这家公司把大模型玩成闭环赚钱机器
零犀科技通过自研因果大模型，专注于提升企业销售业绩，实现规模盈利与正现金流。其RaaS模式强调结果导向，帮助客户直接获得业务增量。后训练机制提升了AI的决...
亚马逊在产品页面上推出 AI 语音对话功能
亚马逊推出了新的AI功能“加入聊天”，用户可以实时向卖家提问并获得语音回复，旨在节省顾客时间并提供关键产品信息，模拟与实体店员工的对话体验。用户可通过“收...
微软推出新型嵌入式 AI 代理，加速迈向“智能代理联络中心”
微软在Dynamics 365联系中心新增了三个AI代理：客户协助代理、质量保证代理和服务运营代理。这些代理利用数据和上下文推理，自动处理客户咨询、监控对...
2.7%的裂缝：全球AI竞赛进入非对称博弈时代
2026年4月，斯坦福大学以人为本人工智能研究所（Stanford HAI）发布了第九版《人工智能指数报告》。这份423页的年度报告，对全球AI技术发展、...
AI语音代理如何应对客户需求高峰
2026年，电话仍是客户体验的重要环节。Metrigy的调查显示，59.1%的消费者愿意尝试AI语音助手，前提是能够转接人工客服。eHealth的AI助手...
我一点也不想要 OpenAI 手机｜AI 器物志
智能手机主导了数字生态，但AI的发展需要超越屏幕，持续感知世界。OpenAI计划推出专为AI Agent设计的手机，改变传统应用交互模式，可能导致用户被异...