本研究提出了一种变分视觉问答(VQA)方法,通过新算法IVON提高多模态视觉问答模型的可靠性,增强校准性和自我放弃率,尤其在分布转变情况下表现突出。
在医学影像中,构建能适应分布变化的模型是个难题。本研究通过微调预训练的视觉和语言模型,展示了其优越性。提出了一种新的贝叶斯不确定性估计方法,用于评估模型在超出分布数据上的表现。实验指出常用指标的局限,并强调贝叶斯不确定性在提升超出分布性能中的潜力。
最近的研究提出了一种适用于视觉-语言基础模型CLIP的小样本微调方法,能够在分布转变下表现出更好的准确性和鲁棒性。
该文章介绍了新的数据集ImageNet-ES,由真实相机在实验环境中捕获的图像组成。作者评估了超出分布范围检测和模型稳健性,发现现有方法无法应对ImageNet-ES的协变量转变。作者观察到,学习环境和传感器变化可以提高模型在ImageNet-C和-ES上的稳健性。通过相机传感器控制可以减轻转变,提高性能。
我们提出了一种基于可识别的潜在环境状态(IDEA)的方法来检测分布转变发生的时间,并通过观察假设来解耦稳态和非稳态潜在状态的变化。IDEA 模型在各种基准数据集上优于最新的非稳态预测方法,突显了其在实际场景中的优势。
完成下面两步后,将自动完成登录并继续当前操作。