本文探讨了推理模型中推理轨迹长度作为置信度估计器的作用。研究表明,推理后训练改变了轨迹长度与准确性之间的关系,且在多种模型和数据集上,轨迹长度与其他置信度估计器相辅相成。此外,高熵或“分叉”标记在这一机制中起着关键作用,证明推理后训练增强了不确定性量化能力。
本研究提出了一种新颖的模型内部置信度估计器(MICE),用于校准工具使用代理的置信度。MICE通过解码语言模型的中间层来评估置信度,显著提高了工具调用的效率和置信度,具备高样本效率和零次泛化能力,适用于不同风险场景。
研究人员提出多种置信度估计技术来解决大型语言模型的事实准确性问题。实验显示,隐藏状态探针提供了最可靠的置信度估计,但需要权重和训练数据。模型在语义等效输入下的置信度不稳定,表明模型参数化知识的稳定性有待提高。
研究人员提出了技术来估计大型语言模型的置信度,发现训练的隐藏状态探针提供了最可靠的置信度估计,但需要权重和训练数据。模型在语义等效的输入中不稳定,改进模型参数化知识的稳定性有改进空间。
我们提出了一种透明物体深度补全的端到端网络,结合了单视图 RGB-D 的深度补全和多视图深度估计的优点,并引入了基于置信度估计的深度细化模块,进一步改进了恢复的深度图。实验证明,我们的方法在具有遮挡的复杂场景中具有更高的准确性和鲁棒性。
本文介绍了一种基于符合性预测的可靠和可信预测器的使用,以便于在实际场景中部署深度学习模型,并提供能够准确反映其不确定性的置信度估计。作者结合新颖的数据集和现代化的目标检测器反复测试了几种符合性方法,并基于符合风险控制提出了新的方法,以此为目的,展示出符合性预测框架在评估模型性能和为实现正式保证的不确定性边界提供实际指导的潜力。
该文介绍了GACE方法,可提高基于LiDAR的三维物体检测器的置信度估计和检测性能,尤其在易受伤害的道路使用者类别中表现优异。
完成下面两步后,将自动完成登录并继续当前操作。