本研究提出了一种新颖的词级对抗策略QA-Attack,通过同义词替换来误导问答模型,显著提高了对抗攻击的成功率。
本研究提出HiSCG架构,解决问答模型在解释答案时的句子层次语义不足问题。通过层次映射优化蕴涵过程,提升解释效果,在EntailmentBank数据集上表现优异。
通过实证评估发现,问答模型的分布稳健性受分布内性能影响,模型的变化不影响稳健性。零样本和上下文学习方法比完全微调的模型更稳健。少样本提示微调模型比少样本微调跨度预测模型更稳健。参数高效和稳健性增强的训练方法对稳健性没有显著改进。
本文研究了生物医学领域中问答模型存在的公平性问题,即由于患者人口统计信息而导致模型输出不合理的变化。研究发现,无关的人口统计信息最多会改变基于知识图谱的系统15%的答案和基于文本的系统23%的答案,包括影响准确性的变化。作者认为这种无理答案变化是一个常见现象,引起了公平性问题,需要更多关注。
本文研究了点击标题破坏的任务,分类了破坏类型并生成了适当的内容。在手动破坏的点击标题帖子语料库上进行了评估,结果显示分类器准确率达到80%,问答模型表现出色。
本文提出了一种基于主动学习的改变监测算法,利用问答模型和虚拟样例更新深度神经网络分类器,并通过对抗模型学习最具表征性、多样性和不确定性的虚拟实例。实验证明该算法性能更好。
完成下面两步后,将自动完成登录并继续当前操作。