小红花·文摘

本研究提出了一种分布鲁棒图形推荐模型（DRGO），旨在解决推荐系统中训练数据噪声样本的影响，显著提升模型在超出分布数据上的表现，并提供了理论证明。

Distributionally Robust Out-of-Distribution Recommendation Based on Diffusion Models

BriefGPT - AI 论文速递 ·

本研究提出了一种新的分布鲁棒离线强化学习算法，结合模型估计和双重悲观策略优化，以解决数据分布偏移问题。通过不确定性集建模转移内核的不确定性，优化最坏情况下的性能，提升算法的鲁棒性和样本效率。研究还探讨了动态规划原理的存在条件及其对算法的影响，提出了DR-LSVI-UCB算法，并验证了其在离线动态强化学习中的有效性。

分布鲁棒离线强化学习的上下界

BriefGPT - AI 论文速递 ·

本文提出了一个基于非参数 $f$- 分歧球构建的分布不确定性集合的广义经验似然框架，用于随机优化问题的统计推断。该方法能够提供一个有原则的选择分布不确定性区域大小的方法，以实现达到精确覆盖的单侧和双侧置信区间。同时，证明了分布鲁棒的公式具有一致性属性。

分布式强化学习的估计与推断

BriefGPT - AI 论文速递 ·