跨渠道竞价的层次化多智能体元强化学习
📝
内容提要
本研究解决了在线广告中实时竞价面临的动态预算分配问题,通过提出一个层次化的多智能体强化学习框架,以实现跨多个渠道的竞价优化。该框架结合了受限于每次点击成本的预算分配模型和针对离线学习中的外推误差的状态-动作解耦演员-评论家方法,显著提升了广告效果,实现了领先的性能。
🏷️
标签
➡️