本研究探讨大型语言模型(LLMs)在与人类交互时的不确定性表达问题。现有模型因过度自信而导致错误,影响用户信任。研究提出新的框架,通过评估多个候选答案的可信度,改善模型的校准能力。实验表明,该方法显著提高了模型输出的准确性和用户信任,尤其在高风险应用中至关重要。
完成下面两步后,将自动完成登录并继续当前操作。