本研究提出了一种新的信心校准框架,解决视觉语言模型(VLMs)口头信心与响应正确性之间的校准问题。通过引入带有高斯噪声的扰动数据集,显著提高了模型的校准能力,增强了用户对模型输出的信任度。
本研究探讨了具身智能体在动态多模态环境中表达信心的方式,提出了信心引导和执行策略,以提升信心校准能力。尽管结构化推理有助于改善校准,但在归纳推理下仍面临不确定性挑战,需要更复杂的引导方法。
本研究提出了一种事实级校准框架,旨在解决大型语言模型在复杂问题回答中的信心校准不足问题。通过相关性加权提高输出准确性,并开发了ConFix方法,实验证明有效减少模型幻觉。
本研究提出动态异常正则化(DOR)方法,解决视觉语言模型微调后信心校准不足的问题。DOR通过减少新文本标签的特征偏差,提升基类和新类的信心校准。实验结果表明,DOR显著提高了微调方法的校准性能。
完成下面两步后,将自动完成登录并继续当前操作。