小红花·文摘

Apple Machine Learning Research ·

本文研究了在线控制未知动态的时变线性系统，提出了一种高效的干扰响应算法，并证明了其适应性悔恨界的优势。同时，探讨了在已知嘈杂动力学下的线性时不变系统的在线学习算法，提出了新的控制器参数化方法，以提高控制效果并实现次线性遗憾。

BriefGPT - AI 论文速递 ·

研究提出了一种新的联邦多臂老虎机问题，通过通信网络合作。算法FEDEXP3可以在不交换代理之间选择的手臂编号或损失序列的情况下得到次线性遗憾。数值评估证明了该算法的有效性。

BriefGPT - AI 论文速递 ·