避免泄露中毒:分布变化下的概念干预
📝
内容提要
本研究解决了概念基础模型在处理分布外(OOD)输入时的表现不足,尤其是当前最先进模型面临的“泄露中毒”问题。这项研究提出MixCEM,一种新颖的概念模型,能够动态地利用仅在训练集中出现的信息,从而显著提升模型在分布内外样本的准确性,尤其是在概念干预的情况下。
➡️
本研究解决了概念基础模型在处理分布外(OOD)输入时的表现不足,尤其是当前最先进模型面临的“泄露中毒”问题。这项研究提出MixCEM,一种新颖的概念模型,能够动态地利用仅在训练集中出现的信息,从而显著提升模型在分布内外样本的准确性,尤其是在概念干预的情况下。