本研究提出OBLIVIATE框架,旨在解决大语言模型中敏感或有毒内容的记忆问题。该框架通过提取目标数据和应用定制损失函数,有效去除不当内容,同时保持模型的实用性,实验结果表明其具有较强的鲁棒性。
该论文介绍了一种使用定制损失函数的方法,通过训练自编码器来实现压缩和去识别化,以解决公共空间中使用人工智能引发的隐私和敏感数据保护问题。同时考虑了压缩率、延迟和人脸、人物检测模型的影响。
完成下面两步后,将自动完成登录并继续当前操作。