小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
推理模型中的轨迹长度是简单的不确定性信号

本文探讨了推理模型中推理轨迹长度作为置信度估计器的作用。研究表明,推理后训练改变了轨迹长度与准确性之间的关系,且在多种模型和数据集上,轨迹长度与其他置信度估计器相辅相成。此外,高熵或“分叉”标记在这一机制中起着关键作用,证明推理后训练增强了不确定性量化能力。

推理模型中的轨迹长度是简单的不确定性信号

Apple Machine Learning Research
Apple Machine Learning Research · 2026-02-12T00:00:00Z
重新审视语言模型中的不确定性量化评估:与响应长度偏差结果的虚假交互

语言模型中的不确定性量化(UQ)对安全性和可靠性至关重要。研究表明,UQ方法与任务正确性函数之间的偏差会系统性扭曲评估结果,影响AUROC排名。分析显示,正确性函数的长度偏差与UQ方法的长度偏差相互作用,导致评估失真。使用LM作为评判者的方法被认为是最不受长度偏差影响的,提供了更公平的UQ评估路径。

重新审视语言模型中的不确定性量化评估:与响应长度偏差结果的虚假交互

Apple Machine Learning Research
Apple Machine Learning Research · 2025-06-27T00:00:00Z

本文研究了支持向量机(SVM)在预测中的不确定性量化,提出了稀疏支持向量分位回归(SSVQR)模型,以提高预测区间的质量,并通过特征选择减少高维数据集中的特征数量。实验结果表明,SVM在概率预测任务中优于现代深度学习模型。

Uncertainty Quantification in SVM Prediction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究通过引入不确定性量化模块,显著提升了大语言模型对不确定性的捕捉能力,增强了幻觉检测性能和可靠性评估。

One Head for Prediction, One Head for Scrutiny: A Pre-trained Uncertainty Quantification Head for Detecting Hallucinations in Large Language Model Outputs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出了一种公平不确定性量化(FUQ)方法,以解决抑郁预测中的公平性问题。通过群体分析和优化策略,验证了该方法在视觉和音频数据集中的有效性。

Fairness Uncertainty Quantification in Depression Prediction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z
科学家用GNN进行不确定性量化,实现高效的分子设计,登Nature子刊

台湾大学研究人员结合不确定性量化、定向信息传递神经网络和遗传算法,优化分子设计,提高化学空间探索的成功率。研究表明,概率改进优化在多目标任务中表现优越,为计算辅助分子设计提供实用指导。

科学家用GNN进行不确定性量化,实现高效的分子设计,登Nature子刊

机器之心
机器之心 · 2025-04-10T05:11:00Z

本研究提出了一种蒙特卡洛时间丢失(MC-TD)方法,旨在解决深度学习模型在回归任务中处理时间序列数据缺失的问题,尤其是由于卫星故障或云遮挡造成的缺失。该方法提升了预测性能和不确定性校准能力,增强了地球观测中的不确定性量化。

地球观测时间序列中时间丢失的分析与回归任务

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z

本研究提出了一种综合框架,旨在解决大型语言模型在医疗应用中的不确定性量化问题,结合贝叶斯推断和深度集成方法,以增强用户信任。

医疗中大型语言模型的不确定性量化挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-07T00:00:00Z

本研究提出了一种基于图注意力的贝叶斯深度展开算法,旨在解决单光子激光成像在嘈杂环境中多目标处理的困难。该方法结合分层贝叶斯模型和神经网络,提升了成像的准确性和不确定性量化能力,实验结果表明其在复杂场景中的表现优越。

Graph Attention-Driven Bayesian Deep Unrolling for Dual-Peak Single-Photon Lidar Imaging

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-03T00:00:00Z

本研究针对大型语言模型在高风险领域应用中的不可靠性,提出了一种新的不确定性量化分类法,以提升模型的可信度,并揭示了不确定性的来源及提升可靠性的挑战。

Uncertainty Quantification and Confidence Calibration in Large Language Models: A Review

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本文研究了缺失链接预测方法,提出了新的加权矩阵分解、布尔矩阵分解和推荐矩阵分解,结合自动模型选择和不确定性量化技术,以提高链接预测的可靠性和准确性。实验结果表明,该方法在蛋白质相互作用网络中显著提升了预测性能。

Matrix Decomposition for Inferring Associations and Missing Links

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本文探讨了人工智能透明性研究中缺失的基础概念,强调不确定性量化的重要性。研究表明,不确定性与反事实可解释性相辅相成,能够通过统一框架增强模型的可靠性和可理解性。

All You Need for Counterfactual Explainability Is a Principled and Reliable Estimate of Aleatoric and Epistemic Uncertainty

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z

本文探讨了大语言模型(LLMs)响应的可靠性,提出了一种多维不确定性量化框架,结合语义和知识感知的相似性分析,通过生成多个响应和张量分解,提高了不确定性量化的准确性。

Quantifying Uncertainty in Large Language Models through Multidimensional Responses

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z
基于人工智能的蒙特卡洛方法将复杂逆问题解决速度提高三倍

该研究提出了一种新方法,利用生成模型和序列采样技术,通过序贯蒙特卡洛法在潜在空间中高效解决逆问题,效率是传统方法的三倍,适用于图像重建和不确定性量化等领域。

基于人工智能的蒙特卡洛方法将复杂逆问题解决速度提高三倍

DEV Community
DEV Community · 2025-02-12T10:01:15Z

本研究提出了一种基于证据深度学习的新模型,旨在克服传统物理知情神经网络在不确定性量化方面的不足,提高对数据噪声的敏感性,并改善边界条件和预测不确定性的覆盖概率。

证据物理知情神经网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z

本研究探讨了单目深度估计中的不确定性量化问题,提出将五种不确定性量化方法与DepthAnythingV2模型结合。通过高斯负对数似然损失微调,研究实现了在保持预测性能的同时,提供可靠的不确定性估计,为机器视觉系统的安全应用奠定基础。

A Critical Synthesis of Uncertainty Quantification and Foundation Models in Monocular Depth Estimation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-14T00:00:00Z

本研究探讨了地球观测产品不确定性量化的可靠性,提出了三个专门设计的基准数据集,以比较不同的不确定性量化方法。这些数据集涵盖回归、图像分割和场景分类等问题,促进了机器学习模型输出质量的准确评估。

不确定性估计的可靠性如何?针对机器学习中不确定性量化的三个新型地球观测数据集的基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究提出了一种基于符号回归的方法,成功识别出12种用于电催化的酸稳定氧化物,仅需30次迭代。该方法通过精确预测和不确定性量化,降低了遗漏潜力材料的风险。

Materials Discovery Workflows Guided by Symbolic Regression: Identifying Acid-Stable Oxides for Electrocatalysis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-08T00:00:00Z

大语言模型在自然语言处理任务中表现优异,但现有的不确定性量化方法在长文本生成中存在局限。我们提出了Luq,一种针对长文本的不确定性量化方法,发现其在准确性相关性上优于现有方法。通过Luq,我们分析了大语言模型的响应信心及其与事实性的关系,发现其在生成罕见事实时缺乏信心。为提高响应的事实准确性,我们提出了Luq-Ensemble方法,通过集成多个模型的响应,显著提升了事实性表现。

探索多模态大语言模型中的响应不确定性:在误导场景下的实证评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z

本研究提出了一种新颖的近似贝叶斯推断方法,通过结合斯坦因变分牛顿更新和海森矩阵近似,改进了深度神经网络在不确定性量化方面的不足,提高了后验分布的准确性和训练效率。

斯坦因变分牛顿神经网络集成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码