本研究构建了NPN构式的语义标注数据集,发现BERT能够有效区分构式及其意义,表明其编码了超越表面句法的语义知识。
本研究解决了句法网络比较中语言和属性数量不足的问题,通过增加语言数量与分析特征,采用新颖的网络分析方法深入探讨特定语言的网络特征。研究发现,不同语言的句法网络中存在普遍保留的结构模式,这为理解语言间的句法联系提供了新的视角。
本研究旨在探讨人们在不同生命阶段(从青少年到老年)语言风格的动态变化。通过运用语言分析工具和方法,研究揭示了个体如何随时间调整和修改语言使用的复杂性,发现对语言学、心理学和传播学有重要影响,阐明了年龄与语言之间的复杂关系。
本研究针对商品评价中特征标签提取的低鲁棒性问题,提出了一种融合依赖解析与情感极性分析的新方法。这一方法显著提高了提取的准确性,实验结果显示准确度达到0.7,召回率和F-score稳定在0.8,表明其有效性。然而,该方法仍依赖于匹配词典,且提取特征标签的范围有限,需在未来研究中进一步探讨。
本文探讨了多语句子编码器在不同预训练策略下对语言特性的表征,特别是语法一致性和形态句法特征的影响。研究发现,掩码语言模型和自回归模型在主谓一致性处理上存在差异,多语言模型在不同语言的编码表现出显著差异。这些发现为未来语言模型的训练和优化提供了重要参考。
本文研究了自然语言中的句法依存关系,探讨了交叉依存关系的稀少性及其原因,提出了新的度量标准以评估语言模型的句法知识,并分析了书写与口语的语法复杂度关系。此外,研究了方言间的句法差异及其相互作用,利用现代自然语言处理技术对英语和德语的句法变化进行了历时分析,揭示了共享词形构造在对话中的作用。
本研究探讨了幽默识别的多种方法,发现负面情感和以人为本的标题最具吸引力。通过卷积神经网络和Transformer模型,研究提高了幽默识别的准确性,并开发了多模态数据集用于幽默分类。此外,研究分析了视觉和语言线索对幽默的影响,提出了HumorDB数据集以增强视觉幽默理解能力。
我们提出通过中间预训练来增强 Transformer 的结构归纳偏差,以执行在给定转换描述的情况下合成生成的依存树的语法转换,实验证明这有助于进行少样本学习和结构化推断。
本文介绍了一种基于句法依存知识的多任务学习模型,结合图卷积网络和消息传递机制,提升情感分析效果。研究提出了KGAN、EMGF和A3SN等创新方法,在多个数据集上实现了最先进的性能。最新的SDEMTIA模型利用句法知识和信息传递机制,显著超越现有方法,并引入BERT作为辅助特征提取器,进一步提升性能。
本研究探讨了多语言BERT(mBERT)在跨语言迁移中的应用,提出通过语言语法和依赖树结构编码来提升自然语言处理任务的性能。研究表明,利用无监督机器翻译生成的合成平行语料库能够有效提取双语词汇表,并在多种语言间实现显著的性能提升。
本文介绍了ParaAMR和ParaBank等同义句数据集的创建及其在自然语言处理中的应用潜力。通过神经机器翻译生成多样化句子,实验表明这些方法在保持语义和语法正确性方面表现优异,尤其在多语言环境中。此外,新提出的多语言词汇简化方法和Para-Ref评估方法显著提高了翻译质量和评估相关性。
本文介绍了多种情感分析和关系抽取模型,包括基于图-序列交互建模的S3E2模型、使用对比训练的三元组抽取模型,以及结合语义增强机制的CasAug模型。这些模型在多个基准数据集上表现优异,显著提升了情感分析和关系抽取的效果。
本文探讨了预训练语言模型(PLMs)在自然语言推理、情感分析和关系提取中的应用,提出了多种自动化提示生成方法和知识引导提示,以提高模型性能。研究表明,这些方法在生物医学知识和文本到SQL查询转换等任务中表现优越,推动了知识转移和提示学习的进展。
本文提出了一种基于语法的上下文示例选择方法,以增强机器翻译的上下文学习,并通过实验证明其有效性。同时,研究探讨了大型语言模型的鲁棒性及其预训练语料库对变异性的影响,发现模型在语法错误修正和信息提取方面的性能有所提升。
本文研究了自然语言理解中的跨度推理,探讨了不同领域中提取精准解释的方法。通过对多种模型和任务的评估,发现最佳跨度表示方法因任务而异,且标记方法通常精度更高。研究还提出了基于语法的结构化模型和远程监督技术,以提升无监督语法分析的性能。
本文提出了一种基于不合语法句法的上下文示例选择策略,以提升大型语言模型在语法错误纠正任务中的表现。研究表明,关注句法信息能有效增强模型性能,且模型的变异性受预训练语料库和监督方法的影响,预训练的代码模型在推广和思维链提示上表现更佳。
本文提出了一种基于句法结构的局部语义注意力机制,结合BERT等预训练模型,提升了句法相关词的关注度。研究表明,BERT的注意力机制与语法和指代密切相关,并在不同任务中表现出遗忘、强化或保留的特征。通过多语言BERT的实验,发现注意力模式有效代表语言结构,新模型在关系分类和问答任务中表现优异。
本文探讨了因果模型的分类与应用,提出了基于贝叶斯框架的因果模型和动态因果网络,强调因果独立性和模块化特性。研究表明,这些新方法在低数据环境下表现优越,提升了因果推理的透明度和准确性。
本文研究了如何通过结构性解析提升Transformer语言模型的句法推理能力,提出了Tree-Planted Transformers(TPT)和结构化语言生成模型(SLGM),展示了在无监督条件下有效学习句法结构的潜力,实验结果表明这些模型在多个任务中具有优越的泛化能力。
该论文介绍了LeBenchmark 2.0,一个用于评估和构建搭载自监督学习的法语语音技术的开源框架。框架包括语料库、预训练的SSL wav2vec 2.0模型和六个下游任务的评估协议。还讨论了语音预训练模型的不同视角和大规模模型训练的碳足迹。
完成下面两步后,将自动完成登录并继续当前操作。