小红花·文摘 - 小红花技术领袖俱乐部

教AI模型说“我不确定”

教AI模型说“我不确定”

MIT News - Computer Science and Artificial Intelligence Laboratory (CSAIL) ·

本研究探讨了文本到SQL系统中的错误检测信心估计问题，提出了一种新方法，通过熵分析将选择性分类器集成到系统中，以改进模型校准。实验结果表明，选择性分类器在识别错误方面更为有效。

Confidence Estimation for Error Detection in Text-to-SQL Systems

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型在非英语语言中的信心估计不足问题。通过多语种信心估计（MlingConf）方法，发现英语在语言无关任务中表现优越，而使用相关语言提示可显著提升语言特定任务的信心估计，从而提高模型的可靠性和准确性。

多语种信心估计的综合研究：针对大型语言模型的 MlingConf

BriefGPT - AI 论文速递 ·