本文评估了神经网络的概率校准,比较了多种校准方法。研究发现,正则化方法在概率校准和锐度之间提供了良好平衡,而修正方法则表现出更优的校准性能。分位数校准作为一种修正方法,具有有限样本覆盖的优势。此外,提出了后处理校准方法和新的评估指标,以提升模型在不同任务中的校准效果。
完成下面两步后,将自动完成登录并继续当前操作。