网络资源分配的在线优化及与强化学习技术的比较
原文中文,约200字,阅读约需1分钟。发表于: 。我们在本文中解决了一种带有任务转移的在线网络资源分配问题,提出了基于指数加权方法的随机在线算法,证明了该算法具有次线性时间后悔,通过对人工数据进行性能测试并与强化学习方法进行比较表明我们的方法优于后者。
本文提出了一种针对多个资源分配问题的算法体系,能够在任意接受数据的情况下获得一定比例最优解,并解决了大型LPs混合装填覆盖问题。同时,还分析了该算法在在线拍卖、网络路由和广告策略方案等特殊情况下的应用。