本文提出了一种端到端生成省略和共指技术模型,结合多任务学习框架,显著提高了对话中的省略和共指识别能力。同时,研究探讨了文档连贯性评估方法和基于强化学习的翻译优化,提升了多语种文档的凝聚力和连贯性。
介绍了一个包含100部英文小说的新数据集,其中包含29,103个指代注释和210,532个标记。文档长度平均为2,105.3个单词,是其他基准数据集的四倍长。数据集还包含了难度指代问题的示例,可用于评估指代消解任务的跨领域性能和分析长距离文档内指代的特征。
本文提出了一种结合BERT和RGAT的解析器,用于研究句法依赖信息对共指消解任务的影响。实验结果表明,该模型能够提高性能。
完成下面两步后,将自动完成登录并继续当前操作。