多点带约束的强化凸优化反馈
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该研究提出了一种针对分布式多智能体贝叶斯优化问题的原始-对偶分布式算法,能够保证已知仿射约束的累积违规性的 O(N√T) 界,且能够对累积违规率进行更强的限制。
🎯
关键要点
-
研究提出了一种针对分布式多智能体贝叶斯优化问题的原始-对偶分布式算法。
-
该算法保证了已知仿射约束的累积违规性的 O(N√T) 界。
-
算法与单智能体情况下的黑盒目标函数和约束函数的遗憾/违规边界相似。
-
平均样本满足仿射约束的误差不超过 O(N/√T)。
-
确定了某些条件以对累积违规率进行更强的限制。
-
在没有仿射约束的情况下,算法提供最佳迭代收敛。
-
该方法应用于高斯过程的采样实例和无线通信的最优功率分配问题。
-
结果表明该方法能提供接近最优的性能,并保持平均违规性较小。
➡️