小红花·文摘

本研究提出了一种图形不确定性方法，旨在解决大型语言模型在长文本生成中的虚构和不确定性问题。通过二分图表示生成与声明的关系，结果显示该方法在多个任务上提高了6.8%的AUPRC，并在事实性方面改善了2-4%。

BriefGPT - AI 论文速递 ·

本文提出了一种模型不可知的方法，通过优化AUC选择函数，并使用AUCROSS算法实现最佳平衡。研究表明，AUPRC与AUROC之间存在关联，强调了对度量标准性能深入理解的重要性。此外，提出了新的评价指标和替代损失函数，以提升分类性能和模型可信度。

BriefGPT - AI 论文速递 ·

本文通过数学分析证明了AUPRC和AUROC可以相互关联，同时揭示了AUPRC的实证不足和误导趋势，强调了对度量标准性能的深入理解的重要性和未经证实假设的危险性。

BriefGPT - AI 论文速递 ·