重新审视语言模型中的不确定性量化评估:与响应长度偏差结果的虚假互动

📝

内容提要

本研究解决了语言模型中的不确定性量化评估存在哪些偏差的问题,特别是常用的正确性函数如何影响评估结果。研究表明,长度偏差在正确性函数错误中的影响会扭曲不确定性量化评估,而使用“LLM作为评审者”的方法则被识别为最少受到长度偏差影响的选择,具有减少这些偏差的潜力。

🏷️

标签

➡️

继续阅读