FreeBuf网络安全行业门户 ·

高级提示注入绕过技术：基于Base64编码绕过的深层分析

💡 原文中文，约10700字，阅读约需26分钟。

📝

内容提要

大模型在处理Base64字符串时，倾向于自动解码，尤其在非结构化文本中。模型通过统计学习和token级语义感知识别并解码Base64内容。这种行为依赖于训练数据中的编码模式，解码后模型能够进行语义理解，可能带来安全隐患。

🎯

🔎

大模型在处理Base64字符串时，自动解码的特性可能导致安全漏洞。攻击者可以利用这一点，通过编码绕过传统的安全防护系统，实施指令注入攻击。因此，开发者在设计系统时需考虑对编码输入的动态识别与解码能力，以防止潜在的安全风险。

不同版本的大模型在自动解码Base64字符串的能力上存在显著差异。例如，Qwen-7B-v1.5表现出较强的解码倾向，而其他模型可能未必具备相同能力。这意味着在选择模型时，需评估其对编码内容的处理能力，以确保安全性和功能性。

随着编码技术的广泛应用，未来的安全防护体系应从单纯的内容过滤转向行为可信性验证。这种转变将有助于构建更为全面的防御机制，能够有效识别和应对潜在的编码攻击，确保系统的安全性。

❓

大模型在处理Base64字符串时，倾向于自动解码，尤其在非结构化文本中，这种行为源于其对编码模式的统计学习能力。

Base64编码通过混淆真实意图，传统安全防护系统依赖静态规则匹配，无法有效识别编码输入，从而存在盲区。

模型在解码前无法感知潜在的恶意意图，存在认知延迟，只有在解码后才能判断内容的危险性。

不同模型版本对Base64字符串的自动解码能力存在差异，例如Qwen-7B-v1.5表现出显著的自动解码行为，而LLaMA-3-8B-Instruct则未明确支持。

攻击者可以将敏感指令以Base64编码嵌入输入文本，诱导模型自动解码并执行，从而绕过传统过滤机制。

未来的安全体系需从内容过滤转向行为可信性验证，构建闭环防御机制，以应对编码绕过攻击的风险。

🏷️