小红花·文摘

本研究探讨了大型语言模型在情感分析中的模型不确定性与变异性，分析其导致的不一致情感分类问题，并提出缓解策略。强调可解释性在提升透明度和用户信任中的重要性，以推动情感分析在金融、医疗等高风险领域的应用。

基于大型语言模型的情感分析中的模型不确定性与变异性概述：挑战、缓解策略与可解释性角色

BriefGPT - AI 论文速递 ·

本研究分析了反事实推理在复杂环境中的局限性，特别是在高模型不确定性和混沌动态下的影响，强调谨慎使用反事实推理的重要性。

When Counterfactual Reasoning Fails: Chaos and the Complexity of the Real World

BriefGPT - AI 论文速递 ·

能够解释其决策的人工智能模型在较少的训练数据下学习效果更佳

DEV Community ·

本研究提出了一种高效的二阶优化方法，针对联邦学习中的模型不确定性和个性化需求，显著提升了预测精度和不确定性估计，优于现有技术。

Federated Learning with Uncertainty and Personalization Based on Efficient Second-Order Optimization

BriefGPT - AI 论文速递 ·

本研究提出了一种通用的策略梯度方法DRPMD，旨在解决强健马尔可夫决策过程中的模型不确定性问题，确保全局最优性，并在复杂场景中验证其强健性和全局收敛性。

Policy Gradient for Robust Markov Decision Processes

BriefGPT - AI 论文速递 ·

本文介绍了一种名为BOSS的贝叶斯模型不确定性模块化强化学习方法，该方法通过乐观选择行动来促进探索。该算法在样本复杂度和收益方面表现优异，适用于高维状态-动作空间。研究强调了乐观探索和模型不确定性在提高学习效率和策略优化中的重要性。

通过乐观汤普森采样的高效模型基础强化学习

BriefGPT - AI 论文速递 ·

本文提出了一种优化视觉语言模型（VLM）在细粒度理解上的方法，通过采样响应的VLM分数提高预测质量。研究表明，VLM在Objaverse数据集上的表现接近人工验证的注释质量，并揭示了模型在多图像推理任务中的局限性。通过引入新的基准测试和数据合成方法，研究改善了视觉推理能力，并探讨了模型的不确定性与准确性之间的关系。

如何确定黑箱视觉语言模型的首选图像分布？

BriefGPT - AI 论文速递 ·

本文提出了多种无模型强化学习算法，旨在优化无限时间平均奖励的马尔可夫决策过程（MDP）。研究包括基于参考优势分解的在线算法、改进的遗憾界限以及处理模型不确定性的策略，提升了学习效率和计算性能，并通过数值实验验证了算法的有效性。

分层平均奖励线性可解的马尔可夫决策过程

BriefGPT - AI 论文速递 ·

本文探讨了深度学习框架和方法在药物研发、广告CTR预测及模型不确定性量化中的应用。研究表明，采用对比学习和自我监督学习等技术能够提升预测性能和效率，解决多目标回归中的频率校准问题，并在动态市场中优化投资回报率。

利用因果学习和符合性预测提高投资回报率

BriefGPT - AI 论文速递 ·

本文探讨了“符合性预测”框架在人工智能中的应用，强调模型不确定性的重要性。该方法适用于深度学习模型，能够提供可靠的置信区间，增强决策的可靠性。研究表明，在遥感和房地产市场等领域，符合性预测有效处理不确定性，提升模型的透明度和准确性。

神经天气模型的有效误差条形图确定

BriefGPT - AI 论文速递 ·

该研究探讨了模型不确定性对马尔科夫决策过程的影响，提出了多种无模型强化学习算法，以提高平均回报的估计和置信区间构建。研究包括针对无限时间持续的MDP问题的两种新算法，以及在满足成本约束下最大化累积奖励的策略优化方法，展示了在多种环境中的优越性能。

约束强化学习的平均奖励目标：基于模型和无模型算法

BriefGPT - AI 论文速递 ·

本文提出了一种基于最大均值差异的变体ELBO，替代KL散度，从而提升图像分类任务的性能。同时，研究了多智能体马尔可夫决策过程中的强化学习算法，以降低智能体成本。此外，探讨了模型不确定性对决策过程的影响，提出了新的不确定Bellman方程和鲁棒Q学习算法，增强了样本效率和算法的鲁棒性。

利用最大均值差异质心在强化学习中传播价值函数的不确定性

BriefGPT - AI 论文速递 ·

本文提出了一种结合强化学习与控制屏障函数的控制器架构，旨在确保系统的安全性和稳定性。通过高斯过程建模系统动态，利用自监督学习框架和控制李雅普诺夫函数来优化控制器参数。实验结果表明，该方法在非线性控制系统中有效降低模型不确定性，提升安全性和性能。

基于强化学习的自适应控制屏障函数的滑动时限控制在安全关键系统中的应用

BriefGPT - AI 论文速递 ·

本研究提出了一种利用模型不确定性的BNN结构学习框架，比普通Bayesian neural networks更稀疏，但精度与竞争模型相当。

深度贝叶斯模型的改进变分推理

BriefGPT - AI 论文速递 ·

该研究提出了HG-DAgger算法，适用于交互式人机模仿学习。该算法训练初学者策略，学习基于模型不确定性的风险度量的安全阈值，以预测状态空间中不同区域的初学者性能。在自动驾驶任务中，该算法表现更好。

离线强化学习和模仿学习的引导式数据增强

BriefGPT - AI 论文速递 ·

本文提出了一种解码策略，通过优化源和目标单词的点间互信息来减少模型不确定性高时的幻觉出现。在 XSum 数据集上进行实验证明，该方法降低了幻觉的概率，同时保持了黄色和 BertS 得分。

用合成任务教授语言模型减少产生幻觉

BriefGPT - AI 论文速递 ·

本文研究了评分者不一致性对模型不确定性的影响，并比较了UNet和TransUNet在标签融合策略和模型不确定性上的差异。通过多类椎旁肌分割案例，揭示了评分者不一致性与不确定性之间的相互作用。

评级人的可变性与基于深度学习的脊旁肌分割的固有不确定性和认识不确定性的关系研究

BriefGPT - AI 论文速递 ·