本文探讨了通过推理时间算法和置信度量化方法提高视觉语言模型的可靠性与准确性。研究表明,模型的不确定性与准确性相关,提出了新的选择回归方法和评估框架,显著提升了多种基准测试中的表现。此外,利用符合性预测方法量化不确定性,增强了模型在安全关键场景中的应用可靠性。
本文提出了一种适配器方法,可在多个不同领域中提高性能,同时提供了推理时间算法来推出新领域的泛化性能,成本较低。
PlaSma是一种利用小型语言模型进行反事实规划的新方法,使用符号化程序知识蒸馏和推理时间算法,可以超越大规模教师模型的能力。
完成下面两步后,将自动完成登录并继续当前操作。