本研究探讨大型语言模型(LLMs)安全机制的脆弱性,认为模板锚定是其易受攻击的关键因素。通过将安全机制与模板区域分离,可以有效降低模型对越狱攻击的脆弱性。
完成下面两步后,将自动完成登录并继续当前操作。