在线广告中基于 LLMs 的真实聚合
原文中文,约400字,阅读约需1分钟。发表于: 。我们提出一种无需微调或访问模型权重的拍卖机制,能有效聚合多个参与者对 LLM 生成的用户查询回复的偏好,并能加入可用的上下文信息,实现快速收敛,从而提高广告主价值和平台收入。
大型语言模型在竞争环境中展示高级推理技能,需要评估环境来探测战略推理和竞争动态场景中的长期规划。AucArena是一个评估LLMs的新型模拟环境,在竞拍中证明了LLMs展示了参与竞拍所需的技能。使用LLM代理模拟复杂社交动态的潜力在竞争环境中表现出来,但个体LLMs的能力存在变异性。最先进的模型(GPT-4)有时会被启发式基准线和人类代理超越,突显了提高LLM代理设计和模拟环境的重要性。