释放反事实增强数据在超出分布的泛化中的潜力
原文中文,约300字,阅读约需1分钟。发表于: 。通过引入两个额外的基于 Counterfactually-Augmented Data 的结构属性约束,从而从 Fisher 的线性判别的角度分析特征空间中的近视现象,本研究发现 Counterfactually-Augmented Data 的潜力没有被充分利用,通过改进的方法,可以提高语言模型的 OOD 泛化能力,进而提高模型性能。
该文提出了一种新方案,使用编码向量空间的自动生成机制减少新数据生成的人工成本,对原始训练数据的一小部分进行注释即可获得明显的准确性改进。实验证明,该方法对情感分类有效,并在使用 IMDb 数据进行训练和 Amazon、SemEval 和 Yelp 等其他数据集进行 OOD 测试时,仅添加 1%手动反事实数据即可获得 + 3%的准确性提升。