内容提要
查询自动补全(QAC)是现代搜索系统的重要功能,但现有方法存在挑战。我们提出了一种统一框架,将QAC重构为端到端列表生成,结合检索增强生成(RAG)和多目标直接偏好优化(DPO),通过创新的多目标优化和混合服务架构,显著提升了搜索效率,并验证了其在生产中的有效性。
关键要点
-
查询自动补全(QAC)是现代搜索系统的重要功能,能够通过建议补全来提高搜索效率。
-
现有方法面临挑战,包括传统检索和排名管道的长尾覆盖不足和大量特征工程需求,以及生成方法的幻觉和安全风险。
-
我们提出了一种统一框架,将QAC重构为端到端列表生成,结合检索增强生成(RAG)和多目标直接偏好优化(DPO)。
-
该方法结合了三项关键创新:将QAC重构为端到端列表生成与多目标优化;综合方法论结合RAG、多目标DPO、学习和基于规则的验证器,以及高质量合成数据的迭代批评-修订;混合服务架构在严格延迟约束下实现高效生产部署。
-
在大型商业搜索平台上的评估显示显著改进:离线指标在各个维度上都有提升,人类评估得分提高0.40到0.69,受控在线实验中击键数减少5.44%,建议采纳率提高3.46%。
-
这项工作代表了由大型语言模型、RAG和多目标对齐驱动的端到端生成的范式转变,建立了一个经过生产验证的框架,能够惠及更广泛的搜索和推荐行业。
延伸问答
什么是查询自动补全(QAC)?
查询自动补全(QAC)是现代搜索系统的一项重要功能,通过在用户输入时建议补全来提高搜索效率。
现有的查询自动补全方法面临哪些挑战?
现有方法面临的挑战包括传统检索和排名管道的长尾覆盖不足、大量特征工程需求,以及生成方法的幻觉和安全风险。
提出的统一框架是如何改进查询自动补全的?
提出的统一框架将QAC重构为端到端列表生成,结合检索增强生成(RAG)和多目标直接偏好优化(DPO),显著提升了搜索效率。
该方法的三项关键创新是什么?
三项关键创新包括将QAC重构为端到端列表生成与多目标优化、综合方法论结合RAG和多目标DPO,以及混合服务架构以实现高效生产部署。
在大型商业搜索平台上的评估结果如何?
评估显示显著改进,离线指标在各个维度上都有提升,人类评估得分提高0.40到0.69,在线实验中击键数减少5.44%,建议采纳率提高3.46%。
这项工作对搜索和推荐行业有什么影响?
这项工作代表了由大型语言模型、RAG和多目标对齐驱动的端到端生成的范式转变,建立了一个经过生产验证的框架,能够惠及更广泛的搜索和推荐行业。