京东科技开发者 ·

【前瞻技术布局】京东零售广告创意：引入场域目标的创意图片生成

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

本文提出了一种基于多模态大型语言模型的广告图像生成方法，旨在提升点击率（CTR）。通过预训练和强化学习，生成与商品特征相符且吸引用户的广告图像。实验结果表明，该方法在CTR预测和生成效果上优于现有技术。

🎯

🔎

本文提出的基于多模态大型语言模型的广告图像生成方法，强调了点击率（CTR）作为核心目标。这一创新不仅提升了广告效果，还为电商平台提供了更具吸引力的广告内容，推动了广告技术的发展。

通过引入强化学习和奖励模型，本文有效地优化了广告图像的生成过程。这种方法能够更好地反映用户的点击偏好，确保生成的广告图像在视觉上与商品特征相符，从而提升用户体验。

文章强调了广告图像中商品与背景之间的相关性，指出现有方法常忽视这一点。通过以商品为中心的偏好优化策略，确保生成的背景与商品特征一致，避免了视觉不协调的问题，提升了广告的整体效果。

❓

京东提出了一种基于多模态大型语言模型的广告图像生成方法，重点优化点击率（CTR），并通过强化学习微调生成模型以更好地反映用户点击偏好。

该方法通过构建奖励模型和以商品为中心的偏好优化策略，确保生成的广告图像背景与商品特征一致，从而提升点击率。

实验结果表明，该方法在CTR预测和生成效果上优于现有技术，在线和离线指标均达到了最先进的性能。

现有方法主要关注美学质量，未能充分考虑与点击率的关系，导致生成的广告图像与用户偏好存在显著差异。

CTR预测任务被重新定义为图像对之间的相对比较任务，以减轻不同商品类别之间的影响。

该方法在大规模多模态电商数据集上进行预训练，构建了图像理解、多模态内容理解和提示词生成的预训练任务。

🏷️