Multi-EuP是一个多语言基准数据集,由欧洲议会的22K多语言文档组成,涵盖24种语言。该数据集旨在研究多语言信息检索(IR)语境中的公平性,分析排名语境中的语言和人口统计偏差。研究人员报告了Multi-EuP在单语和多语信息检索基准测试方面的有效性,并对由分词策略选择引起的语言偏差进行了初步实验。
完成下面两步后,将自动完成登录并继续当前操作。