小红花·文摘

本研究探讨大型语言模型（LLMs）在与人类交互时的不确定性表达问题。现有模型因过度自信而导致错误，影响用户信任。研究提出新的框架，通过评估多个候选答案的可信度，改善模型的校准能力。实验表明，该方法显著提高了模型输出的准确性和用户信任，尤其在高风险应用中至关重要。