FreeBuf网络安全行业门户 ·

研究人员发现新型攻击方式，可通过图像和音频操纵大模型

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

研究人员在2023年欧洲黑帽大会上展示了一种利用图像和音频向AI聊天机器人注入恶意指令的攻击方式。攻击者通过隐藏恶意指令在图像和音频中，操纵机器人的响应，可能导致用户访问恶意URL、泄露个人信息等恶意行为。研究人员计划展示攻击示例，证明这种攻击方式的可行性。目标是找到用户无法察觉的方式将提示注入到聊天机器人中，不影响机器人正确回答问题。这种攻击方式可能对整合大语言模型的组织造成重大损害。

🎯

关键要点

研究人员在2023年欧洲黑帽大会上展示了一种利用图像和音频向AI聊天机器人注入恶意指令的攻击方式。
攻击者通过隐藏恶意指令在图像和音频中，操纵聊天机器人的响应，可能导致用户访问恶意URL和泄露个人信息。
研究人员计划展示攻击示例，证明这种攻击方式的可行性。
攻击者的目标是找到用户无法察觉的方式将提示注入到聊天机器人中，而不影响机器人的正常回答。
这种攻击方式可能对整合大语言模型的组织造成重大损害。
研究人员的攻击示例针对PandaGPT和LLaVa多模态LLM，展示了如何通过音频和图像注入指令。
研究的目标之一是以用户无法察觉的方式间接注入提示，确保不影响LLM的正常回答。
研究表明，LLM容易受到提示注入攻击，攻击者可以通过设计输入影响模型输出。
间接提示注入攻击不同于常规提示注入，用户在此情况下更像是受害者而非攻击者。
研究人员指出，攻击者可以通过网络钓鱼或社交工程诱骗用户输入恶意图像或音频。
这项研究的重要性在于许多组织急于将LLM功能整合到应用程序中，攻击者可能造成重大损害。

🏷️

继续阅读

国产大模型编码能力实测(GLM 5.1、Kimi K2.6、Mimo v2.5 Pro 和 DeepSeek V4 Pro)
本文对四款国产大模型（GLM 5.1、Kimi K2.6、Mimo v2.5 Pro 和 DeepSeek V4 Pro）的编码能力进行了实测。结果显示，...
LWiAI播客第242期 - ChatGPT图像2.0，Qwen 3.6 Max，Kimi-K2.6
本期播客讨论了最新的AI新闻，包括OpenAI发布的ChatGPT图像2.0模型，生成文本和截图的能力显著提升；阿里巴巴推出Qwen 3.6 Max，转为...
Rivian’s revenue is up as R2 production kicks into gear
Rivian reported its first quarter earnings of 2026, providing us a closer loo...
Rivian downsizes its goals for its EV factory in Georgia
Rivian announced some changes today with regard to the factory its building i...
The logic of the racist Supreme Court isn’t adding up
Close watchers of the Supreme Court knew that the conservative supermajority ...
人工智能沙箱正迎来其Kubernetes时刻
Recently, Anthropic announced that its new model, Mythos, had autonomously fo...

研究人员发现新型攻击方式，可通过图像和音频操纵大模型

内容提要

关键要点

标签

继续阅读