本研究提出了一种安全高效的Lyapunov优化算法(SELO),用于解决在线凸优化中的未知线性预算约束问题。该算法实现了$O( ext{sqrt}(T))$的悔恨值,并确保约束累计违背为零。应用于分布式数据中心的能效任务处理,验证了其计算效率和理论有效性。
本文介绍了一种新型无投影算法用于在线凸优化,具有领先的遗憾保证。其遗憾界限为$ ilde{O}( ext{sqrt}(dT) + ext{kappa} d)$,主要项不受可行集非球面率$ ext{kappa}$影响,克服了传统方法的局限性,并在约束随机凸优化中实现了更快的收敛速度。
本文探讨了在线凸优化问题的解决方案,提出了有效的收敛算法,并分析了适应性在线梯度下降和基于随机梯度下降的线性回归算法。这些方法在处理约束和异常值方面表现优异,提供了新的遗憾界限和优化策略。
本文提出了一种在线凸优化算法,能够在动态环境中有效降低动态遗憾。该算法通过利用流畅性条件和问题相关的数量,自适应复杂度,优化在线学习器性能,并在强凸损失函数下实现几乎最优的动态遗憾率。
本文研究动态环境下的在线凸优化问题,提出自适应学习方法Ader,结合专家跟踪算法以最小化动态遗憾。通过改进传统算法,提出在新数据到达时遗忘历史的关键算法,确保鲁棒性。研究还探讨了在线学习中的动态比较基准及其在零和博弈中的应用,优化强凸损失函数的动态调参算法,展示了在非稳态环境中优异的动态后悔表现。
本文提出了一种理论框架,将任务相似性的复杂形式化与在线凸优化和序列预测算法融合。该方法能够自适应地学习任务相似性,提供更精确的转移风险界限,并在任务环境动态变化或任务共享几何结构的情况下导出高效算法的平均情况后悔界限。通过修改几种流行的元学习算法,改善了它们在少样本学习和联邦学习问题上的性能。
该论文提出了一种基于在线凸优化的强化学习新框架,探讨了镜像下降及相关算法,并提出了一种新的类似于梯度下降的迭代方法。抛物线梯度强化学习法比常规TD学习更为普适。同时,还提出了一种新型的稀疏镜像下降强化学习方法,具有显著的计算优势。
完成下面两步后,将自动完成登录并继续当前操作。