本研究揭示了一种利用大型语言模型(LLM)偏离上下文的越狱技术,成功绕过九个聊天机器人的安全限制,成功率为62%。这表明现有安全训练存在重大缺陷,需改革测试方法以确保LLM的安全性。
完成下面两步后,将自动完成登录并继续当前操作。