本研究提出了一种广义概率建模方法,以改进LLM作为评判者的不确定性估计。该方法结合绝对和比较评分,显著提高了个体比较的准确性,减少了约50%的比较次数,从而提升了系统效率。
本文研究了在稀缺和高度可变环境中,航空图像分类的符合预测方法。通过微调预训练模型,发现符合预测能够在复杂任务中提供有价值的不确定性估计,并强调模型压缩技术在资源受限环境中的潜力。
大型语言模型(LLMs)在遵循用户指令方面存在显著局限性,影响其在高风险应用中的可靠性。我们首次系统评估了LLMs在指令遵循中的不确定性估计能力,发现现有方法在处理细微错误时表现不佳,尽管内部模型状态有所改善,但仍无法应对复杂场景。这些发现为理解LLMs的局限性和不确定性估计提供了重要见解。
本研究提出了一种新方法,将不确定性估计技术融入反事实解释中,以提高其真实性。结果表明,传统方法显著降低了预测误差,增强了反事实的科学价值,特别是在处理不符合分布的数据时,突显了其在可解释人工智能中的重要性。
本研究提出了一种名为ON-Traffic的深度操作网络框架,旨在解决传统交通流估计方法的空间覆盖局限性。该框架利用移动探测车辆数据,有效捕捉复杂交通现象并提供准确的不确定性估计,推动在线自适应交通管理系统的发展。
本研究提出了EU-Nets及其框架MHEX+,旨在克服传统U-Net模型在可解释性和不确定性估计方面的不足,从而提高模型的可解释性和准确性。
本文探讨了伪装物体检测中的不确定性估计与利用,提出了一种结合计算机视觉与脑机接口的人机协作框架。研究表明,该框架在CAMO数据集上显著提高了检测性能,降低了人类认知负荷,增强了系统可靠性。
本研究提出了一种基于排名的一致性预测(RCP-GNN)框架,旨在解决图神经网络在高风险场景下缺乏严格不确定性估计的问题。实验结果表明,该模型在节点分类任务中有效降低了效率损失。
本研究提出了UAlign框架,通过不确定性估计增强大型语言模型的事实知识对齐。实验结果表明,UAlign提高了模型对已知问题的回答信心,并有效拒绝未知问题,展现出良好的性能和泛化能力。
本文探讨了大型语言模型(LLMs)在遵循用户指令时的可靠性,指出其在高风险应用中的局限性。研究首次系统评估了LLMs的不确定性估计能力,并提出了受控评估设置以比较不同条件下的不确定性估计方法。结果显示,现有方法在模型细微错误时表现不佳,揭示了LLMs在指令遵循任务中的不足。
研究者提出了WHALE框架,用于学习可泛化的世界模型,以增强决策能力。该框架结合行为条件和回溯滚动技术,解决了泛化和不确定性估计的挑战。实验结果表明,WHALE在模拟和现实任务中表现优异,展现出强大的泛化能力和扩展性。
本研究提出UNSCT-HRNet框架,旨在解决全髋关节置换术中因患者姿势不当或解剖标志遮挡导致的标志检测问题。通过引入空间关系融合模块和不确定性估计模块,模型在无结构数据上的准确性提高超过60%,展现出良好的鲁棒性,具有自动化解决方案的潜力。
本文探讨了深度学习中的不确定性估计、神经网络架构设计及其应用,提出了随机不可训练的“先验”网络和基于不确定性的剪枝技术,以提高模型性能和鲁棒性。这些研究为深度学习的优化和泛化能力提供了新见解。
本文探讨了多种基于神经网络的概率模型和方法,旨在提高推理性能和不确定性估计。研究包括神经粒子平滑法、噪声感知训练、选择性标签平滑和校准感知贝叶斯神经网络等,均在序列识别和翻译任务中取得了先进效果,并提供了开源代码和数据支持。
本文提出Stein混合推断(SMI)方法,解决了Stein变分梯度下降(SVGD)在小型贝叶斯神经网络中方差崩溃的问题,显著提升了高维稀疏数据的不确定性估计准确性。
本研究提出了一种概率语言-图像预训练(ProLIP)方法,旨在解决传统视觉语言模型在图像与文本多对多关系中的不足。ProLIP通过概率目标在大规模数据集上进行预训练,结合不确定性估计和包容性损失,显著提升了下游任务的表现和图像分类的准确率,展示了其实际应用潜力。
本研究提出了一种一致性校准(CC)方法,旨在解决深度学习模型在不确定性估计中的误校准问题。该方法通过扰动输入的一致性进行自校准,无需额外数据,显著提高计算效率。实验结果表明,CC在多个数据集上表现优异。
本研究提出了一种不确定性感知的集成深核学习模型(UEDKL),旨在提高网络攻击检测的准确性和不确定性估计。该模型通过捕捉数据分布和模型参数,显著提升了网络安全领域的检测性能,为应对网络攻击提供了新方案。
本文探讨了贝叶斯岭回归与异步共形预测的有效性,提出了一种基于鲁棒性预测推断的不确定性估计模型。研究表明,自适应预测区间方法在多种数据集上表现优越,强调了不确定性的重要性,并提出了适应性保形推断(ACI)以解决时间序列数据中的有效性问题。
本研究在证据深度学习中提出了Re-EDL变种,通过将先验权重作为可调超参数,优化Dirichlet分布的期望,避免过度自信,提高预测性能。实验结果表明,该方法在不确定性估计方面表现优异。
完成下面两步后,将自动完成登录并继续当前操作。