小红花·文摘

本研究探讨了语言模型重排名器在检索增强生成任务中的表现不足，特别是在处理语义信息方面的局限性。提出了一种基于BM25的新分离度量，揭示了重排名器在词汇不相似性方面的错误，并探讨了提升其性能的方法，强调了对更具对抗性评估数据集的需求。