本文研究了基于预训练语言模型的文本分类任务在主题分布变化时的性能差距,并验证了经典PLMs和现代大模型都面临领域转移的挑战。通过增加主题控制的合成文本,F1得分在某些主题上提高了50%,但其他主题则没有改进。该方法适用于其他分类任务。
完成下面两步后,将自动完成登录并继续当前操作。