本研究提出了一种图形不确定性方法,旨在解决大型语言模型在长文本生成中的虚构和不确定性问题。通过二分图表示生成与声明的关系,结果显示该方法在多个任务上提高了6.8%的AUPRC,并在事实性方面改善了2-4%。
本文通过数学分析证明了AUPRC和AUROC可以相互关联,同时揭示了AUPRC的实证不足和误导趋势,强调了对度量标准性能的深入理解的重要性和未经证实假设的危险性。
完成下面两步后,将自动完成登录并继续当前操作。