本研究探讨了离散时间线性动态系统中的时间视界不确定性,特别是在状态分布不明确时的成本估计问题。通过建立离散时间马尔可夫链与全球渐进稳定系统的等价关系,提出了一种基于Wasserstein模糊集的分布鲁棒成本估计方法,并提供了多项式时间算法及理论研究结果,具有重要应用价值。
本文提出了一种基于分布鲁棒性的优化方法——主题条件风险值(topic CVaR),用于解决语言模型在未知测试分布下的性能问题。该方法在广泛的潜在测试分布下表现良好,并且相对于标准最大似然估计法(MLE),在使用 Yelp 评论和新闻混合训练语言模型,并仅在评论数据上进行测试时,实现了 5.5 点困惑度的降低。
本文介绍了一种名为ADA-NSTORM的方法,利用自适应学习率解决组合型最小极大优化问题,比NSTORM更有效。该方法推动了组合型最小极大优化的发展,保证了分布鲁棒性和策略评估的关键能力。
完成下面两步后,将自动完成登录并继续当前操作。