大型语言模型如ChatGPT在搜索结果排名上表现优异,甚至超过了专门的搜索系统。新测试数据集NovelEval用于验证新知识的排名。一个440M的小模型在直接段落排名中超越了3B的监督模型。
本研究提出了一种新方法,基于长上下文大语言模型进行段落排名,解决了滑动窗口效率低的问题。实验结果表明,该方法在监督微调下显著提升了效率和有效性。
完成下面两步后,将自动完成登录并继续当前操作。