MIT News - Artificial intelligence ·

识别过度自信的大型语言模型的更好方法

💡 原文英文，约1000词，阅读约需4分钟。

📝

内容提要

MIT研究人员提出了一种新方法，通过比较目标模型与类似模型的回答，识别自信但错误的响应。他们的总不确定性度量（TU）结合自我一致性和模型间不一致性，能更有效地识别不可靠的预测，尤其在唯一正确答案的任务中表现突出。

🎯

🔎

大型语言模型（LLM）在生成答案时可能表现出过度自信，即使其答案是错误的。这种现象在医疗和金融等高风险领域尤为危险，可能导致用户对预测的准确性产生误解。因此，了解和识别这种过度自信的能力对于确保决策的可靠性至关重要。

MIT研究人员提出的总不确定性度量（TU）结合了自我一致性和模型间不一致性，能够更有效地识别不可靠的预测。这种方法在处理唯一正确答案的任务时表现尤为突出，显示出其在提高模型可靠性方面的潜力。

尽管TU在特定任务中表现优异，但在开放性任务中可能效果不佳。这提示研究人员在未来的工作中需要调整和优化该技术，以提升其在更复杂问题上的表现，确保其广泛适用性。

❓

通过比较目标模型与类似模型的回答，识别自信但错误的响应。

TU结合了自我一致性和模型间不一致性，以更准确地评估不可靠的预测。

传统方法主要依赖模型自我一致性，可能导致过度自信的错误。

TU在处理唯一正确答案的任务时效果最佳，如事实问答。

未来研究可能会调整TU以提高开放性查询的性能，并探索其他形式的随机不确定性。

TU通常需要的查询次数少于计算自我一致性的方法，从而降低计算成本和节省能源。

🏷️