BriefGPT - AI 论文速递 ·

具有单调性约束的安全贝叶斯优化的无懊悔算法

💡 原文中文，约1300字，阅读约需3分钟。

📝

内容提要

本文探讨了在线学习中的后悔最小化和安全约束的广义元算法，提出了一种基于高斯过程的优化算法，具有渐近最优的遗憾保证，并降低了计算复杂度。同时，研究了黑盒函数的顺序优化和安全策略的改进，提出了新的算法框架，以确保在不准确动态下的性能。

🎯

❓

安全贝叶斯优化的无懊悔算法是一种在线学习算法，旨在最小化后悔并满足安全约束，使用高斯过程进行优化。

该算法通过引入新的复杂度度量和比例变换，平衡乐观探索与悲观约束满足，从而降低了计算复杂度。

高斯过程用于估计未知的安全约束，并通过域缩小和树形分区优化，提高算法的性能和收敛性。

该算法提出了一种新的Gaussian过程Bandit优化算法，能够在无噪声样本和Bandit反馈下进行顺序优化。

通过改进的SafeOpt算法，结合最新的高斯过程界限，确保在多种函数类上算法的安全性表现优于现有算法。

无懊悔学习算法的收敛性质表明，许多经典的凸一阶方法可以被视为该框架的特殊情况，具有良好的收敛性。

🏷️