GAS:基于后训练搜索的生成式自动出价
📝
内容提要
本研究针对生成式自动出价在面对低质量数据和偏见的情况下,影响模型泛化能力和决策质量的问题,提出了一种灵活实用的生成式自动出价方案GAS。该方法通过后训练搜索来优化基础策略模型的输出,结合小型评估器和MCTS灵感的搜索机制,显著提升了对不同偏好的适应能力,实验结果表明在实际广告平台上实现了显著的效果提升。
➡️
本研究针对生成式自动出价在面对低质量数据和偏见的情况下,影响模型泛化能力和决策质量的问题,提出了一种灵活实用的生成式自动出价方案GAS。该方法通过后训练搜索来优化基础策略模型的输出,结合小型评估器和MCTS灵感的搜索机制,显著提升了对不同偏好的适应能力,实验结果表明在实际广告平台上实现了显著的效果提升。