Supporting Information Retrieval for Low-Resource Languages: Establishing the Urdu MS MARCO Benchmark

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究首次提出了大规模乌尔都语信息检索数据集,并通过机器翻译处理MS MARCO数据集。经过微调的模型显著提升了乌尔都语检索性能,推动了多语言信息检索的发展。

🎯

关键要点

  • 本研究首次提出了大规模乌尔都语信息检索数据集。
  • 通过机器翻译处理MS MARCO数据集。
  • 经过微调的模型显著提升了乌尔都语检索性能。
  • 研究推动了多语言信息检索的发展。
  • 强调了包容性检索技术的道德和社会重要性。
➡️

继续阅读