SePer:通过语义困惑度降低测量检索效用
📝
内容提要
本研究针对现有检索增强生成(RAG)方法评估中的不足,提出了新的自动化评估方法,以信息增益为视角来测量检索质量。具体而言,我们引入了语义困惑度(SePer)这一指标,量化检索对减少语义困惑度的有效性,实验证明SePer与人类偏好高度一致,并在多种RAG场景中提供更精准高效的检索效用评估。
➡️
本研究针对现有检索增强生成(RAG)方法评估中的不足,提出了新的自动化评估方法,以信息增益为视角来测量检索质量。具体而言,我们引入了语义困惑度(SePer)这一指标,量化检索对减少语义困惑度的有效性,实验证明SePer与人类偏好高度一致,并在多种RAG场景中提供更精准高效的检索效用评估。