SePer:通过语义困惑度降低测量检索效用

📝

内容提要

本研究针对现有检索增强生成(RAG)方法评估中的不足,提出了新的自动化评估方法,以信息增益为视角来测量检索质量。具体而言,我们引入了语义困惑度(SePer)这一指标,量化检索对减少语义困惑度的有效性,实验证明SePer与人类偏好高度一致,并在多种RAG场景中提供更精准高效的检索效用评估。

➡️

继续阅读