随着大型语言模型的发展,基准测试成为评估其性能的重要标准。MTEB是用于嵌入模型的通用基准,但存在过拟合问题。RTEB作为新基准,专注于真实检索任务,结合公共和私有数据集,提供更准确的评估,适用于多种行业和语言。
Hugging Face推出了检索嵌入基准(RTEB),旨在更准确地评估嵌入模型在实际检索任务中的泛化能力。该基准结合了公开和私有数据集,涵盖法律、医疗、金融等领域,支持多种语言,力求成为AI检索性能的社区标准。
完成下面两步后,将自动完成登录并继续当前操作。