小红花·文摘

本研究评估了多个大型语言模型在回答300个胃肠病学问题时的自我报告反应确定性。尽管新模型表现较好，但普遍存在过度自信的倾向，这对医疗健康中安全使用大型语言模型提出了挑战。

BriefGPT - AI 论文速递 ·

本文提出了一种新方法InpDiffusion，旨在解决图像修复定位中的过度自信和边界检测困难问题。通过引入边缘条件和监督策略，提升了修复图像的细节感知，显著提高了定位的准确性和鲁棒性。

BriefGPT - AI 论文速递 ·

DEV Community ·

本文介绍了几种校准方法，包括焦点损失、温度缩放和参数化温度缩放等，这些方法可以提高分类模型在测试数据上的校准表现，并解决过度自信的问题。实验证明这些方法在多个数据集上都取得了良好的效果。

BriefGPT - AI 论文速递 ·

本研究针对深度神经网络分类器的过度自信预测问题，提出了K+1路softmax公式和基于能量的目标函数，以改进开放世界中的OOD检测。通过引入辅助样本和伪样本，提升了模型在领域漂移下的可靠性和校准性，实验结果表明该方法在OOD检测上优于现有技术，具有较高的可信度。

BriefGPT - AI 论文速递 ·

本文提出了一种基于自动编码器的新方法，通过生成接近真实数据的数据集，改善深度神经网络的性能，解决过度自信问题。该方法在时间序列和MNIST数据集上取得成功，并验证了其在自动驾驶轨迹预测中的有效性。

BriefGPT - AI 论文速递 ·