DeepTeam是一个针对大型语言模型的红队框架,旨在帮助研究人员识别安全和鲁棒性问题。它提供攻击策略、评估工具和可扩展的测试管道,以支持模型的安全性和质量评估,并促进社区的贡献。
本研究提出了一种新红队框架EVA,旨在应对多模态代理在图形用户界面中的间接提示注入攻击。EVA通过动态监测代理的注意力分布,调整对抗线索,从而提高攻击的成功率和适应性。实验结果表明,该框架在多种场景下显著提升了攻击效果。
完成下面两步后,将自动完成登录并继续当前操作。