该文介绍了一个新的数据集,用于评估大型语言模型在异构知识源上的检索能力。作者提出了一种新颖的方法,利用多个检索工具来解决挑战,并展示了该方法在解决推理挑战方面的优越性。
完成下面两步后,将自动完成登录并继续当前操作。