利用领域适应和数据增强提高英语和阿拉伯语中古兰经 IR 的效果

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

通过神经信息检索方法研究了阿拉伯语和英语古兰经信息检索问题,通过训练和数据增强技术在MRR@10和NDCG@5指标上取得明显改善,为古兰经信息检索设立了新的技术标杆。

🎯

关键要点

  • 研究了阿拉伯语和英语的古兰经信息检索问题
  • 采用最新的神经信息检索方法
  • 通过大量通用领域数据训练后,继续在特定领域数据上训练
  • 使用数据增强技术
  • 在MRR@10和NDCG@5指标上取得明显改善
  • 为古兰经信息检索设立新的技术标杆
➡️

继续阅读