小红花·文摘

本文探讨了大型语言模型（LLMs）在不确定性量化和风险评估中的应用，提出了新的评估框架和方法，以提高模型在多选题和高风险领域的可靠性。研究表明，符合性预测与模型准确性密切相关，并提出了风险调整校准方法DwD，以降低决策风险和综合风险，强调了提升模型能力和安全性的重要性。