突破残差量化的沙漏现象:提升生成式检索的上限

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了PAG,一种新的优化和解码方法,通过同时解码来指导生成式检索模型中文档标识符的自回归生成。PAG在性能上超过了现有的生成式检索模型,在MS MARCO上提高了15.6%的MRR,并且查询延迟方面达到了22倍的加速。

🎯

关键要点

  • PAG是一种新的优化和解码方法。
  • PAG通过同时解码指导生成式检索模型中文档标识符的自回归生成。
  • PAG为每个文档构建基于集合和顺序的标识符。
  • 基于集合的标识符基于词汇标记建立。
  • 顺序标识符通过量化文档的基于相关性的表示获得。
  • 在MS MARCO和TREC深度学习赛道数据上,PAG的性能超过现有生成式检索模型。
  • PAG在MS MARCO上提高了15.6%的MRR。
  • PAG在查询延迟方面达到了22倍的加速。
➡️

继续阅读