小红花·文摘

大型语言模型函数调用的不确定性量化

Apple Machine Learning Research ·

本文介绍了如何利用scipy.stats进行高效的概率建模和不确定性量化。通过冻结分布、蒙特卡罗模拟、参数扫描、重尾分布建模和自助法置信区间，数据科学家能够更好地应对业务风险和决策不确定性，简化模型设计，提高模拟效率，并准确评估极端事件。

5个使用Scipy.stats模拟‘如果’场景的技巧

KDnuggets ·

推理模型中的轨迹长度是简单的不确定性信号

Apple Machine Learning Research ·

重新审视语言模型中的不确定性量化评估：与响应长度偏差结果的虚假交互

Apple Machine Learning Research ·

本文研究了支持向量机（SVM）在预测中的不确定性量化，提出了稀疏支持向量分位回归（SSVQR）模型，以提高预测区间的质量，并通过特征选择减少高维数据集中的特征数量。实验结果表明，SVM在概率预测任务中优于现代深度学习模型。

Uncertainty Quantification in SVM Prediction

BriefGPT - AI 论文速递 ·

本研究通过引入不确定性量化模块，显著提升了大语言模型对不确定性的捕捉能力，增强了幻觉检测性能和可靠性评估。

One Head for Prediction, One Head for Scrutiny: A Pre-trained Uncertainty Quantification Head for Detecting Hallucinations in Large Language Model Outputs

BriefGPT - AI 论文速递 ·

本研究提出了一种公平不确定性量化（FUQ）方法，以解决抑郁预测中的公平性问题。通过群体分析和优化策略，验证了该方法在视觉和音频数据集中的有效性。

Fairness Uncertainty Quantification in Depression Prediction

BriefGPT - AI 论文速递 ·

科学家用GNN进行不确定性量化，实现高效的分子设计，登Nature子刊

机器之心 ·

本研究提出了一种蒙特卡洛时间丢失（MC-TD）方法，旨在解决深度学习模型在回归任务中处理时间序列数据缺失的问题，尤其是由于卫星故障或云遮挡造成的缺失。该方法提升了预测性能和不确定性校准能力，增强了地球观测中的不确定性量化。

地球观测时间序列中时间丢失的分析与回归任务

BriefGPT - AI 论文速递 ·

本研究提出了一种综合框架，旨在解决大型语言模型在医疗应用中的不确定性量化问题，结合贝叶斯推断和深度集成方法，以增强用户信任。

医疗中大型语言模型的不确定性量化挑战

BriefGPT - AI 论文速递 ·

本研究提出了一种基于图注意力的贝叶斯深度展开算法，旨在解决单光子激光成像在嘈杂环境中多目标处理的困难。该方法结合分层贝叶斯模型和神经网络，提升了成像的准确性和不确定性量化能力，实验结果表明其在复杂场景中的表现优越。

Graph Attention-Driven Bayesian Deep Unrolling for Dual-Peak Single-Photon Lidar Imaging

BriefGPT - AI 论文速递 ·

本研究针对大型语言模型在高风险领域应用中的不可靠性，提出了一种新的不确定性量化分类法，以提升模型的可信度，并揭示了不确定性的来源及提升可靠性的挑战。

Uncertainty Quantification and Confidence Calibration in Large Language Models: A Review

BriefGPT - AI 论文速递 ·

本文研究了缺失链接预测方法，提出了新的加权矩阵分解、布尔矩阵分解和推荐矩阵分解，结合自动模型选择和不确定性量化技术，以提高链接预测的可靠性和准确性。实验结果表明，该方法在蛋白质相互作用网络中显著提升了预测性能。

Matrix Decomposition for Inferring Associations and Missing Links

BriefGPT - AI 论文速递 ·

本文探讨了人工智能透明性研究中缺失的基础概念，强调不确定性量化的重要性。研究表明，不确定性与反事实可解释性相辅相成，能够通过统一框架增强模型的可靠性和可理解性。

All You Need for Counterfactual Explainability Is a Principled and Reliable Estimate of Aleatoric and Epistemic Uncertainty

BriefGPT - AI 论文速递 ·

本文探讨了大语言模型（LLMs）响应的可靠性，提出了一种多维不确定性量化框架，结合语义和知识感知的相似性分析，通过生成多个响应和张量分解，提高了不确定性量化的准确性。

大型语言模型函数调用的不确定性量化

5个使用Scipy.stats模拟‘如果’场景的技巧

推理模型中的轨迹长度是简单的不确定性信号

重新审视语言模型中的不确定性量化评估：与响应长度偏差结果的虚假交互

Uncertainty Quantification in SVM Prediction

One Head for Prediction, One Head for Scrutiny: A Pre-trained Uncertainty Quantification Head for Detecting Hallucinations in Large Language Model Outputs

Fairness Uncertainty Quantification in Depression Prediction

科学家用GNN进行不确定性量化，实现高效的分子设计，登Nature子刊

地球观测时间序列中时间丢失的分析与回归任务

医疗中大型语言模型的不确定性量化挑战

Graph Attention-Driven Bayesian Deep Unrolling for Dual-Peak Single-Photon Lidar Imaging

Uncertainty Quantification and Confidence Calibration in Large Language Models: A Review

Matrix Decomposition for Inferring Associations and Missing Links

All You Need for Counterfactual Explainability Is a Principled and Reliable Estimate of Aleatoric and Epistemic Uncertainty

Quantifying Uncertainty in Large Language Models through Multidimensional Responses

基于人工智能的蒙特卡洛方法将复杂逆问题解决速度提高三倍

证据物理知情神经网络

A Critical Synthesis of Uncertainty Quantification and Foundation Models in Monocular Depth Estimation

不确定性估计的可靠性如何？针对机器学习中不确定性量化的三个新型地球观测数据集的基准测试

Materials Discovery Workflows Guided by Symbolic Regression: Identifying Acid-Stable Oxides for Electrocatalysis