本研究提出了一种新方法CG2C,通过提取文档上下文图进行多跳推理,解决了传统自然语言推断数据不足的问题。实验结果表明,FactCG模型在连接推理方面表现优越,且模型规模更小。
本研究提出了一种新的联合模型,结合上下文化语言模型与神经网络,针对越南语自然语言推断(NLI)进行研究,F1得分最高达到82.78%。
本研究针对多源无监督领域适应中的源域选择复杂性问题,提出了渐进微调框架和三种轻量级图路由策略,从而提高了自然语言推断和情感分析任务的准确率。
本文评估了三种基于Transformer的模型(RoBERTa、XLNet和BERT)在自然语言推断和问答任务中的鲁棒性,发现其在脆弱性测试中优于循环神经网络,但仍有改进空间。研究提出了基于语义和上下文的增强方法,显著提升了模型的鲁棒性,并通过对抗样本和新数据集的构建,进一步提高了模型在多样化信息下的表现,强调了鲁棒性评估的重要性。
本文探讨通过对手博弈学习和外部知识提升自然语言推断(NLI)模型的鲁棒性,减少假设偏见和虚假关联。研究表明,结合外部知识和对抗性框架能显著提高模型性能,降低自相矛盾解释的风险,并增强模型对微小语义变化的敏感性。
本文提出了一种稀疏最大函数,类似于传统的softmax,但输出稀疏概率。研究表明,在多标签分类和自然语言推断中,稀疏最大函数能够提供更精细的注意力焦点,且性能与传统softmax相似。此外,提出了新的凸损失函数和自适应稀疏转换器,以改善模型的可解释性和性能。
本文探讨了多种基于梯度提升决策树的算法在自然语言推断和特征选择中的应用,介绍了FreeGBDT、DGBF和GBFS等新方法,这些方法在多个数据集上展现了优越的分类精度和特征提取能力,尤其在高维数据和非线性特征相互作用方面表现良好。
本文研究了多语言自然语言推断(NLI)数据集的改进与应用,涵盖14种语言的MNLI数据集,探索资源匮乏语言中的模型训练效果。提出了IndicXNLI和SciNLI等新数据集,分析了不同预训练模型的表现,强调了多语言推断的挑战与进展。
该论文研究了自然语言推断数据的微调潜力,以提高信息检索和排名的效果,并通过使用来自波兰最大的电子商务网站和选定的开放领域数据,对英语和波兰语进行了验证。结果显示,使用对比损失和 NLI 数据进行微调可以提高模型在不同任务和语言方面的性能,并且有潜力改善单语和多语模型。最后,研究了嵌入向量的一致性和对齐性,以解释基于 NLI 的微调在域外应用中的效果。
该研究探讨了外部知识对自然语言推断系统性能的影响,发现不同来源的知识影响不同。同时,进行了最大规模、最精细的可解释NLI众包研究,揭示了自动性能分数与人的评分存在巨大差异。
本文提出了一种新的激活函数——稀疏最大函数,能够输出稀疏概率,并给出了其特性及雅可比矩阵的高效计算方法。同时,提出了一个新的平滑且凸函数作为逻辑损失的稀疏最大函数的对应,并发现它与 Huber 分类损失之间的联系。实验结果表明,在多标签分类和自然语言推断的基于注意力机制的神经网络中,采用稀疏最大函数可以获得类似的性能,但具有更精细、更紧凑的注意力焦点。
本文探讨了利用有监督的自然语言推断数据训练句向量的方法,比较了多种句向量表征结构,发现BiLSTM + max pooling效果最佳,明显优于无监督的SkipThought方法。句向量的评估主要有两种方式:用于下游任务和相似度度量。提出了layer norm以解决batch norm在RNN中的限制,实验表明其在RNN模型中效果更佳。
完成下面两步后,将自动完成登录并继续当前操作。