本研究提出了一种新方法,通过让大型语言模型(LLMs)表达回答的不确定性来进行自信评分。研究表明,提问方式显著影响评分的可靠性,特定的提问方法能够提取良好校准的自信评分,为未来的不确定性量化提供了新思路。
完成下面两步后,将自动完成登录并继续当前操作。