基于文本的神经协同过滤模型用于论文来源追踪
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
研究人员使用注意力机制的双向长短期记忆网络和环境信息构建了一个比以前数据集大数个数量级的新数据集,并在标准和新数据集上达到了最先进的性能。他们还使用可解释的模型揭示了促进和抑制引用的特定语言的运用,并发现了改进预测的关键。他们还检查了模型的错误预测,并发现了人类引用行为和来源数据中的系统性错误。他们将这个新数据集、代码和基于网络的工具提供给社区。
🎯
关键要点
-
研究人员使用注意力机制的双向长短期记忆网络和环境信息检测需要引用的句子。
-
构建了一个比以前数据集大数个数量级的新数据集PMOA-CITE。
-
在标准ACL-ARC数据集上达到了最先进的性能,F1值为0.507。
-
在新数据集PMOA-CITE上表现出很高的性能,F1值为0.856。
-
模型可以在这些数据集之间进行迁移学习。
-
使用可解释的模型揭示了促进和抑制引用的特定语言的运用。
-
改进预测的关键是章节和周围句子。
-
检查模型的错误预测,发现人类引用行为和来源数据中的系统性错误。
-
为模型在提交前和存档过程中检查文档提供了可能性。
-
将新数据集、代码和基于网络的工具提供给社区。
➡️