广义概率建模与比较LLM作为评判者中的不确定性估计改进 本研究解决了在比较LLM作为评判者框架中的不确定性估计问题。论文提出了一种广义的概率建模方法,能够提供更准确的个体比较不确定性估计,并通过结合绝对和比较评分显著提高性能。实验结果表明,该方法减少了所需比较次数约50%,有效提升了系统的效率。 本研究提出了一种广义概率建模方法,解决了大型语言模型(LLM)作为评判者的不确定性估计问题。该方法结合绝对评分与比较评分,减少比较次数约50%,显著提升系统效率。 不确定性估计 大型语言模型 广义概率建模 建模 系统效率 评分