本研究提出OBLIVIATE框架,旨在解决大语言模型中敏感或有毒内容的记忆问题。该框架通过提取目标数据和应用定制损失函数,有效去除不当内容,同时保持模型的实用性,实验结果表明其具有较强的鲁棒性。
完成下面两步后,将自动完成登录并继续当前操作。