组合赌博机的双标准优化:在赌博反馈下的次线性遗憾和约束违反
📝
内容提要
本文解决了组合多臂赌博机(CMAB)中的双标准优化问题,提出一个框架,将离线双标准近似算法转化为具有次线性遗憾和累积约束违反保证的在线算法。研究表明,该框架在处理多种组合问题时具有广泛的适用性,并能够适应离线算法到在线情境中的保证,提高了算法的灵活性和实用性。
➡️
本文解决了组合多臂赌博机(CMAB)中的双标准优化问题,提出一个框架,将离线双标准近似算法转化为具有次线性遗憾和累积约束违反保证的在线算法。研究表明,该框架在处理多种组合问题时具有广泛的适用性,并能够适应离线算法到在线情境中的保证,提高了算法的灵活性和实用性。