小红花·文摘

本研究提出了一种新算法，旨在解决在线线性编程中的高计算成本和低效能问题。该算法结合线性编程和一阶OLP方法，通过周期性重解LP子问题，实现高效的在线决策，并提高后悔保证。

BriefGPT - AI 论文速递 ·

该论文提出了一种广义的勘探-开发权衡模型，可以在时间序列上对任意凹奖励和凸度约束进行决策，并对时间范围进行规定。通过扩展UCB算法，提供了一个具有近乎最优的后悔保证的多项式时间算法，同时还提供了更高效的算法。

BriefGPT - AI 论文速递 ·