小红花·文摘

本研究探讨了自然分布转移对CNN在真实交通数据中的检测质量和置信度评估的影响。提出了一种新颖的数据集，包括恶劣天气场景和边界情况。研究发现在特定分布转移下，采用MC-Dropout的选择性整合可提升任务性能和置信度估计。

预测准确性与可靠性：在分布转移下的分类与目标定位

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）对世界信念的表达及其置信度评估，提出了准确度、连贯性、一致性和应用等标准来评估不同置信度估计方法的有效性。实验结果表明，训练的隐藏状态探针提供了最可靠的置信度估计，但在语义等效输入下，模型的置信度表现不稳定，显示出改进的空间。此外，研究还探讨了引用方法在长文档处理中的应用，提出了自信度引出方法及其优缺点，并强调了对模型置信度的重新校准。

关于对大型语言模型的置信度归属

BriefGPT - AI 论文速递 ·