本文研究了自然语言模型(如T5、BART、GPT-2、GPT-3等)的知识校准,提出了提高模型置信度和准确性的有效方法。实验结果表明,校准显著提升了模型表现,并探讨了不同模型在概率估计中的一致性问题,提出了新框架以改善输出评估的可信度。
完成下面两步后,将自动完成登录并继续当前操作。