小红花·文摘

本文研究了视觉-语言模型的置信度量化，提出了UNK-VQA数据集以提升模型对无法回答问题的弃权能力。通过评估多模态模型的不确定性，旨在增强AI系统的可信度，并探讨贝叶斯深度学习在计算机视觉任务中的应用，提出新的损失函数和框架以提高模型的鲁棒性。

BriefGPT - AI 论文速递 ·

本文探讨了通过推理时间算法和置信度量化方法提高视觉语言模型的可靠性与准确性。研究表明，模型的不确定性与准确性相关，提出了新的选择回归方法和评估框架，显著提升了多种基准测试中的表现。此外，利用符合性预测方法量化不确定性，增强了模型在安全关键场景中的应用可靠性。

BriefGPT - AI 论文速递 ·