LASIGE 和 UNICAGE 对 NASA LitCoin NLP 竞赛的解决方案
原文中文,约200字,阅读约需1分钟。发表于: 。本研究介绍了将工业数据工程解决方案与生物医学命名实体识别和关系抽取系统相结合,通过引入来自其他数据集和生物医学本体知识的附加训练数据,以解决生物医学自然语言处理中的文本处理问题。我们在 2022 年 LitCoin NLP 挑战中使用了这一流程,并与大约 200 个参赛团队合作,最终获得了第七名的奖项,彰显了学术界(LASIGE)与工业界(Unicage)之间成功的合作。
本研究提出了一种新的自然语言推理应用,针对合同的文档级自然语言推理。该应用解决了合同审查耗时和昂贵的问题,并发布了包含607个合同的最大语料库。研究者引入了新算法,通过多标签分类和更复杂的上下文分割方法取得了显著进展。他们认为该领域有改进空间。