京东科技开发者 ·

【前瞻技术布局】打破“沙漏“现象→提高生成式搜索/推荐的上限

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

本文探讨了生成式搜索/推荐中的“沙漏”现象，指出中间层tokens过于集中导致路径稀疏和长尾分布，影响模型性能。实验分析提出移除第二层和自适应调整token分布的解决方案，有效缓解了这一问题，提升了模型效果。

🎯

🔎

“沙漏”现象在生成式搜索/推荐中显著影响模型性能，尤其是在电子商务领域。中间层tokens的集中导致路径稀疏和长尾分布，使得模型在处理多样化用户需求时表现不佳。理解这一现象有助于开发更有效的推荐系统，提升用户体验。

本文提出的移除第二层和自适应调整token分布的策略，能够有效缓解“沙漏”现象。这些方法不仅提升了模型性能，还保持了计算成本的可控性。对于实际应用，选择合适的策略将直接影响推荐系统的效果和效率。

未来的研究应关注优化SID的生成与表征方式，尤其是引入时效性和统计特征，以满足复杂的排序需求。此外，统一稀疏与密集表征将有助于更全面地捕捉数据特征，推动生成式搜索/推荐技术的进一步发展。

❓

“沙漏”现象是指中间层tokens过于集中，导致路径稀疏和长尾分布，从而影响模型性能。

主要原因是路径稀疏性和长尾分布，这导致了生成式搜索/推荐方法的表示能力受限。

可以通过移除第二层tokens或自适应调整token分布来缓解“沙漏”现象。

RQ-SID方法在电子商务领域表现出色，但受到“沙漏”现象的影响，限制了其性能。

实验显示，头部标记测试集性能显著提升，而尾部标记测试集性能较差，验证了路径稀疏性和长尾分布的影响。

未来规划包括优化SID的生产与表征方式，统一稀疏与密集表征，以及保证链路无损失实现一段式搜索。

🏷️