小红花·文摘

本研究提出OBLIVIATE框架，旨在解决大语言模型中敏感或有毒内容的记忆问题。该框架通过提取目标数据和应用定制损失函数，有效去除不当内容，同时保持模型的实用性，实验结果表明其具有较强的鲁棒性。