地理位置是人道主义响应的关键要素。最新的自然语言处理发展可以帮助从大量人道主义领域产生的报告和文件中提取关键信息。本研究利用Spacy和roBERTa进行人道主义文本的地理标记,提出了一个名为FeatureRank的地理编码方法。发现人道主义领域的数据不仅提高了分类器的性能,而且缓解了现有工具的偏见。需要更多来自非西方文件的资源,以确保现成的NER系统适用于人道主义领域的部署。
本研究使用Spacy和roBERTa对人道主义文本进行地理标记,并提出了FeatureRank的地理编码方法。研究发现,人道主义领域的数据不仅提高了分类器性能,还减轻了现有工具的偏见。为了确保现有的NER系统适用于人道主义领域的部署,需要更多来自非西方文件的资源。
完成下面两步后,将自动完成登录并继续当前操作。