代理安全基准(ASB):形式化与基准化基于LLM的代理的攻击与防御
原文中文,约400字,阅读约需1分钟。发表于: 。本文解决了现有文献中对基于大型语言模型(LLM)的代理攻击与防御评估不全面的问题。提出的“代理安全基准”(ASB)框架形式化、基准化与评估LLM代理的攻击与防御,发现了不同阶段的关键漏洞,攻击成功率高达84.30%。此项研究为代理安全领域的重要问题提供了新的洞见与挑战。
大型语言模型在软件系统中面临操作空间广泛、跨应用合作和用户约束的挑战。通过AndroidArena基准测试发现,先进的LLM代理在跨应用和遵守约束方面仍有困难。研究通过分析反思能力的不足,提出策略将成功率提高了27%,揭示了LLM代理的细粒度弱点,并为未来研究提供方向。