小红花·文摘

本研究提出了一种新方法，通过让大型语言模型（LLMs）表达回答的不确定性来进行自信评分。研究表明，提问方式显著影响评分的可靠性，特定的提问方法能够提取良好校准的自信评分，为未来的不确定性量化提供了新思路。