概率评估单标签多类分类任务的优越评分规则

本研究介绍了一种称为惩罚 Brier 评分（PBS）和惩罚对数损失（PLL）的新型优越评分规则，以改进概率分类模型的评估。PBS 和 PLL 通过引入对错误分类的惩罚，修改传统的适当评分规则，以一致地给正确的预测分配更好的分数。实验证明，PBS 和 PLL 在模型选择、模型检查点和提前停止方面具有潜在的优势，并与 F1 分数等指标相关性更高。PBS 和 PLL...

本研究介绍了惩罚Brier评分（PBS）和惩罚对数损失（PLL）用于改进概率分类模型评估。实验证明PBS和PLL在模型选择、检查点和提前停止方面具有优势，并与F1分数相关性更高。PBS和PLL提高模型准确性和可靠性，弥补不确定性量化和准确性最大化之间的差距。