多点带约束的强化凸优化反馈

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该研究提出了一种针对分布式多智能体贝叶斯优化问题的原始-对偶分布式算法,能够保证已知仿射约束的累积违规性的 O(N√T) 界,且能够对累积违规率进行更强的限制。

🎯

关键要点

  • 研究提出了一种针对分布式多智能体贝叶斯优化问题的原始-对偶分布式算法。

  • 该算法保证了已知仿射约束的累积违规性的 O(N√T) 界。

  • 算法与单智能体情况下的黑盒目标函数和约束函数的遗憾/违规边界相似。

  • 平均样本满足仿射约束的误差不超过 O(N/√T)。

  • 确定了某些条件以对累积违规率进行更强的限制。

  • 在没有仿射约束的情况下,算法提供最佳迭代收敛。

  • 该方法应用于高斯过程的采样实例和无线通信的最优功率分配问题。

  • 结果表明该方法能提供接近最优的性能,并保持平均违规性较小。

➡️

继续阅读