京东科技开发者 ·

【前瞻技术布局】打破“沙漏“现象→提高生成式搜索/推荐的上限

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

本文探讨了生成式搜索中的“沙漏”现象，指出中间层tokens过于集中导致路径稀疏和长尾分布，影响RQ-SID性能。实验分析后，提出移除第二层tokens和自适应调整token分布的方案，有效提升了模型性能，为未来优化奠定基础。

🎯

🔎

沙漏现象导致生成式搜索中的路径稀疏性和长尾分布，显著影响模型性能。尤其是在电子商务领域，头部标记的推荐效果较好，而尾部标记的表现则较差。这种不均衡的性能表现可能会影响用户体验，尤其是在多样化需求的场景中。

本文提出的两种解决方案，即移除第二层tokens和自适应调整token分布，具有实际应用价值。特别是自适应策略能够在保持模型性能的同时，减少长尾效应的影响，为生成式搜索的优化提供了新的思路。

未来的研究可以集中在优化SID的生成与表征方式，尤其是引入时效性和统计特征，以满足对特征的排序需求。此外，统一稀疏与密集表征的策略也将有助于提升模型的整体表现，值得关注。

❓

“沙漏”现象是指中间层tokens过于集中，导致路径稀疏和长尾分布，从而限制了生成式搜索/推荐方法的性能。

沙漏现象导致路径稀疏性和长尾分布，显著影响RQ-SID的性能，尤其是在头部标记和尾部标记测试集上的表现差异。

可以通过移除第二层tokens或自适应调整token分布来解决沙漏现象，这两种方法都能有效提升模型性能。

通过对第二层标记分布的统计分析，发现其表现出低熵、高基尼系数和大标准差，支持了沙漏现象的存在。

自适应token移除策略在大多数评估指标上优于基线模型，有效减少了长尾效应的影响，提升了模型性能。

未来规划包括优化SID的生产与表征方式，统一稀疏与密集表征，以及保证链路无损失实现一段式搜索。

🏷️