本研究比较了调整模型和极大语言模型在可检测可信度主张任务中的性能。实验结果表明,调整模型在跨域设置中优于零样本方法。
本研究评估了预训练语言模型在句子入侵检测任务中的对话建模能力。结果显示,预训练LM在域内表现出色,但在跨域设置中下降明显,对跨域推广能力有限。新的语言探测数据集结果显示,跨域设置有改进空间。
完成下面两步后,将自动完成登录并继续当前操作。