本研究介绍了多个针对性别偏见的指代消解数据集和方法,包括WinoBias、GAP和Counter-GAP,旨在消除自然语言处理中的性别刻板印象。研究表明,通过数据增强和新模型,指代消解系统的性能在性别平衡的数据集上显著改善。
本研究探讨了英语小说中角色的文体表征,发现融合的文体和主题信息能够有效区分角色,同时在引文归属上不需超越语义模型。研究还关注人物识别和指代消解等任务,评估了先进模型的表现,并提出了针对角色研究的文体测量模型的必要性。
本文介绍了新的孟加拉语数据集BenCoref,评估了多种模型在指代消解任务中的表现,强调了特定语言资源的需求,并探讨了跨语言和多语种指代解析的挑战与进展。
本文提出了一种结合视觉和文本信息的多模态跨文档事件共指解析方法,通过线性映射和集群表征提升指代消解效果。研究分析了不同模型在跨文档指代消解中的表现差异,并探讨了基于神经网络的匹配方法在实体和事件识别中的应用,旨在推动事件共指消解技术的发展。
本文提出了一种结合指代消解的序列标注方法,利用BERT模型和指代消解算法提高人名识别的准确率。研究表明,该方法在数据预处理、动态词向量获取和子串识别方面优于传统方法,未来可扩展至机构名、地名等实体识别,提升京东小程序的文本识别效果。
本文介绍了多个新数据集,涵盖指代消解和命名实体识别等任务,特别是包含大量文学文本的注释数据集。这些数据集旨在评估跨领域性能,分析指代特征,推动自然语言理解研究的发展。
介绍了一个包含100部英文小说的新数据集,其中包含29,103个指代注释和210,532个标记。文档长度平均为2,105.3个单词,是其他基准数据集的四倍长。数据集还包含了难度指代问题的示例,可用于评估指代消解任务的跨领域性能和分析长距离文档内指代的特征。
中间任务包括中文分词、词性标注、NER、句法分析、指代消解、语义Parser等,一般作为解决实际需求任务的中间或辅助阶段。最终任务包括文本分类、文本相似性计算、机器翻译、文本摘要等,能直接呈现给用户。
完成下面两步后,将自动完成登录并继续当前操作。