本研究提出了一个公开的多语言数据集,标注了激进化水平、行动召唤和命名实体,分析了注释过程中的偏见及其对模型性能的影响,强调了构建稳健数据集的重要性。
本文探讨了英、泰、僧三语并行语料库中低资源语言(僧伽罗语和泰米尔语)的命名实体标注问题,利用预训练的多语言模型建立了新的基准识别结果,展示了其在低资源神经机器翻译中的应用价值。
本研究提出了一种新方法,将维基百科知识融入神经主题模型,解决同形异义词问题。该方法能识别命名实体,提高模型泛化能力,并有效捕捉主题时间序列发展。实验结果验证了其有效性。
大型语言模型在处理语音输入时识别命名实体有挑战。本文提出一种基于检索的方法:先检测语音中的命名实体,再用该实体从个人数据库中检索相似实体,进行上下文感知解码。在语音助手任务中,该方法使命名实体错误率降低73.6%,词错误率降低30.2%,且无需完整数据库,提高效率。
2023年eBay大学机器学习挑战赛的冠军团队NullPointer由五名美国研究生组成,他们将于2024年夏季在eBay实习。该比赛鼓励学生提出创新的电子商务解决方案,NullPointer团队开发了一种能够准确识别和标记“命名实体”的模型,广泛应用于eBay的商品信息提取。此次比赛吸引了1439名学生参与,创下历史新高。
本研究提出了一种支持立场提取网络(SEN),可以在一个统一的框架中提取多模态证据的不同立场,并引入基于命名实体的共现关系计算的支持 - 反驳分数到文本 SEN 中。实验结果显示,该方法优于现有的基线模型,最佳模型在准确率上取得了3.2%的性能提升。
完成下面两步后,将自动完成登录并继续当前操作。