本研究提出了一种新方法SCOPE,通过压缩数学推理步骤,显著降低过程注释的计算成本。该方法将自然语言推理转化为代码并归一化,构建压缩前缀树,从而提升性能并节约资源。
本研究提出了一种新方法,通过傅里叶展开生成令牌ID的嵌入向量,解决了基于变压器的NLP模型中嵌入层参数过多的问题,显著减少了参数数量,并在自然语言推理任务中表现出竞争力的性能。
本研究探讨大型语言模型(LLMs)在重述和翻译任务中检测内在幻觉的能力。分析显示,不同模型在任务表现上存在差异,但在特定提示下表现一致,自然语言推理模型表现优异,表明LLM检测方法并非唯一选择。
本研究提出了一种新方法,利用大型视觉语言模型和自然语言推理来量化图像真实性,识别常识违反的图像,并在WHOOPS!数据集上实现了零-shot模式的新最优表现。
AIxiv专栏促进学术交流,研究团队提出CodePlan框架,通过代码规划提升大模型推理能力,解决自然语言推理中的结构性缺陷。实验表明,CodePlan在复杂任务中表现优异,并开源200万条数据,推动相关研究发展。
本研究提出了一种名为MorphNLI的模块化方法,针对自然语言推理中的分类问题。该方法通过逐步变化前提句生成假设句,利用现有NLI模型跟踪推理过程,从而提高准确率,尤其在跨领域设置中可提升12.6%。
本研究系统调查了大型语言模型(LLMs)在自然语言推理中的表现,强调逻辑形式的重要性,并比较了人类与LLMs在逻辑推理方面的异同。
本研究提出了一种神经符号对比学习方法,旨在解决预训练语言模型在自然语言推理任务中的文本扰动敏感性和对大数据集的依赖问题,从而显著提升推理能力和逻辑准确性。
本研究提出了一种新的上下文学习蒸馏方法,旨在解决自然语言推理任务中大模型训练资源消耗过大的问题。通过将OPT-1.3B模型的参数压缩至1.25亿,外域准确率显著提高。
本研究聚焦于自动任务指导中的程序性错误检测(PMD),通过问答自对话形式提升透明度,并利用自然语言推理模型生成一致性指标,从而显著提高模型性能和对话效率。
本研究探讨了预训练模型在自然语言推理中的表现,发现模型在矛盾类别上对抗攻击的韧性较强。通过对抗攻击实验,模型在推理和中性类别上的准确率显著下降,而矛盾类别的下降幅度较小,表明细调对抗示例能增强模型的鲁棒性。
本文探讨了自然语言推理(NLI)任务中的新方法,包括使用LSTM模型生成蕴含句子、数据增强和迁移学习。研究表明,生成多样化的合成数据和引入人工解释能显著提升模型性能,尤其在少样本和无监督学习中。强调了多样化语言表达对NLI模型发展的重要性。
该研究探讨了自然语言推理(NLI)在大型语言模型(LLM)评估中的应用。通过分析五个NLI基准在六种不同规模模型上的表现,发现NLI任务能够有效区分模型的大小和质量,且模型在训练过程中的准确性良好。尽管模型与人类标签的相似性随规模增加而提升,但仍有改进空间。
本研究提出了一种基于轻量化DeBERTa编码器的命名实体识别(NER)和自然语言推理(NLI)系统,用于检测法律违规行为。NER系统在LegalLens挑战中取得60.01%的F1分数,NLI系统达到84.73%。这两种系统的表现显著优于大型语言模型,展示了其在法律违规检测中的潜力。
本研究提出了一种反事实推理模型,通过生成反事实样本来模拟人类思维,从而提升情感分析和自然语言推理的效果。采用数据增强和对抗生成技术,显著提高了模型的鲁棒性和性能。同时,研究探讨了大型语言模型在反事实生成中的应用,强调多样化语言表达对自然语言推理的重要性。
本研究提出了一种名为推理调优的方法,旨在改善稠密段落检索中的相关性评分模糊性问题。实验结果表明,该方法能有效提升检索性能,并与现有方法高效结合。
研究表明,预训练语言模型在自然语言推理中表现良好,但在本体论推断方面需要更多背景知识。通过结合外部知识源和新方法,可以提升模型的上下文处理能力,减少幻觉现象。研究提出了评估本体完成方法的基准,发现混合策略效果最佳,并针对大型语言模型的幻觉现象开发了新的数据集和框架,以推动本体匹配领域的发展。
本文提出了一种基于理解的机器阅读理解模型,结合自然语言推理、多头注意力和多语言学习机制,以解决模型的敏感性和泛化能力问题。研究还分析了大型语言模型在条件问答中的表现,发现微调后的模型在某些任务上超越现有技术,但在抽取性问答中仍面临挑战。强调了评估指标的重要性,并提出了提升模型性能的需求。
SemEval-2024 任务 2 聚焦于临床试验中的安全生物医学自然语言推理,旨在提升大语言模型在干预和因果推理方面的能力。研究使用了多种模型,特别是 BioMistral 模型,展示了其在医学问答任务中的优越性能,并探讨了多语言评估的可行性,推动个性化医疗的发展。
该研究介绍了波斯语自然语言推理任务的新数据集FarsTail,包含10,367个样本,旨在为不同语言的NLP研究提供基础。同时,研究提出了EasyInstruct框架,以促进指导处理的研究,提升大型语言模型的性能。
完成下面两步后,将自动完成登录并继续当前操作。