小红花·文摘

SkillsMiddleware 是 DeepAgents 框架中的中间件，用于加载和展示代理技能，支持渐进式披露和后端存储源的技能加载。每个技能包含 SKILL.md 文件，定义技能的元数据和功能。系统提示会注入可用技能信息，遵循安全限制和路径约定。

司马他 ·

本文讨论了Spring Boot中的代码审计挑战，重点在于通过ClassPathXmlApplicationContext类的构造函数，利用用户输入的类名和参数执行任意命令。文章分析了如何通过通配符和环境变量绕过安全限制，并分享了多种利用方法及参与者反馈。

离别歌 ·

Prompt注入攻击是黑客通过恶意指令操控AI模型，可能导致敏感信息泄露或系统滥用。攻击者利用模型对输入的依赖性设计恶意Prompt，绕过安全限制。防御策略包括语料清洗、输入检测、用户管理和API安全，以增强AI模型的安全性。

FreeBuf网络安全行业门户 ·

本研究提出了一种对抗性分词方法，旨在解决现有大语言模型仅考虑单一分词的问题。该方法有效绕过安全限制，并与先进的对抗性方法竞争，揭示了子词模型的新漏洞。

BriefGPT - AI 论文速递 ·

DEV Community ·

GamerNoTitle ·

DEV Community ·

本研究揭示了一种利用大型语言模型（LLM）偏离上下文的越狱技术，成功绕过九个聊天机器人的安全限制，成功率为62%。这表明现有安全训练存在重大缺陷，需改革测试方法以确保LLM的安全性。

BriefGPT - AI 论文速递 ·

宝玉的分享 ·