本研究提出StealthRank方法,旨在解决大型语言模型在信息检索中的对抗性排名操纵问题。该方法通过能量优化和Langevin动态生成隐匿提示序列,悄然影响排名机制,展现出优于现有基线的隐秘性和有效性。
该研究探究了忽略离决策边界较远的数据样本对于表示学习、能量优化和边距增长的影响,并提出了奖励分类正确的方法。实证验证证明该方法可以提高性能并解决复杂场景下的问题。
完成下面两步后,将自动完成登录并继续当前操作。