本研究探讨了大型语言模型(LLM)自信度的校准问题,提出多种方法改善模型对输出可信度的评估。研究表明,用户对模型可信度的感知受解释方式影响,透明的可信度传达在高风险应用中尤为重要。引入新的评估框架和学习方法后,模型的过度自信得以降低,输出的可靠性和准确性得到提升。
完成下面两步后,将自动完成登录并继续当前操作。