利用领域适应和数据增强提高英语和阿拉伯语中古兰经 IR 的效果
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
通过神经信息检索方法研究了阿拉伯语和英语古兰经信息检索问题,通过训练和数据增强技术在MRR@10和NDCG@5指标上取得明显改善,为古兰经信息检索设立了新的技术标杆。
🎯
关键要点
- 研究了阿拉伯语和英语的古兰经信息检索问题
- 采用最新的神经信息检索方法
- 通过大量通用领域数据训练后,继续在特定领域数据上训练
- 使用数据增强技术
- 在MRR@10和NDCG@5指标上取得明显改善
- 为古兰经信息检索设立新的技术标杆
➡️