小红花·文摘

本研究探讨了大型语言模型（LLM）自信度的校准问题，提出多种方法改善模型对输出可信度的评估。研究表明，用户对模型可信度的感知受解释方式影响，透明的可信度传达在高风险应用中尤为重要。引入新的评估框架和学习方法后，模型的过度自信得以降低，输出的可靠性和准确性得到提升。