研究表明,基础大型语言模型(LLMs)在开放领域问答任务中能够有效评估其语义信心,尽管未经过专门训练。文章提出了一种理论机制,解释了语义校准如何作为下一个标记预测的副产品,并通过实验验证了基础LLMs在问答任务中的语义校准性。
完成下面两步后,将自动完成登录并继续当前操作。