在ChatGPT中推出锁定模式和提升风险标签
OpenAI
·
提示注入:生成式人工智能安全挑战的新前沿
DEV Community
·
DeepMind研究人员提出针对大型语言模型提示注入的防御措施
InfoQ
·
通过结构化查询(StruQ)和偏好优化(SecAlign)防御提示注入攻击
The Berkeley Artificial Intelligence Research Blog
·
护墙 -- 提示注入检测框架
BriefGPT - AI 论文速递
·