小红花·文摘

本文探讨了大型语言模型（LLM）置信度校准的新方法，提出通过多校准技术和多模型协作来提高置信度分数的准确性。研究表明，合理的提示策略和温度缩放能显著降低校准误差，并提出了新的评估指标以分析模型输出的可信度，旨在提升模型生成答案的可靠性。