京东科技开发者 ·

【前瞻技术布局】打破“沙漏“现象→提高生成式搜索/推荐的上限

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

本文探讨了生成式搜索/推荐中的“沙漏”现象，指出中间层tokens过度集中导致数据稀疏和长尾分布。通过实验，提出移除第二层和自适应调整token分布的方案，有效提升模型性能，为未来优化奠定基础。

🎯

🔎

“沙漏”现象在生成式搜索/推荐中显著影响模型性能，尤其是在电子商务领域。中间层tokens的集中导致路径稀疏和长尾分布，使得模型在处理复杂数据时表现不佳。理解这一现象有助于开发更有效的推荐系统，提升用户体验。

文章提出的两种解决方案，即移除第二层tokens和自适应调整token分布，具有实际应用价值。特别是自适应策略能够在保持模型性能的同时，减少计算成本，为实际应用中的模型优化提供了新的思路。

未来的研究应关注如何优化SID的生成与表征方式，特别是引入时效性和统计特征，以满足对特征的高要求。此外，统一稀疏与密集表征将有助于更全面地捕捉数据特征变化，推动生成式搜索/推荐技术的发展。

❓

“沙漏”现象是指中间层tokens过度集中，导致数据稀疏和长尾分布，从而限制了生成式搜索/推荐的性能。

主要原因是路径稀疏和长尾分布，这两者显著影响了模型的性能。

可以通过移除第二层tokens或自适应调整token分布来解决这一问题。

RQ-SID方法在电子商务领域表现出潜力，但受到“沙漏”现象的限制。

实验显示，头部标记测试集的性能显著提升，而尾部标记测试集的性能较差，验证了路径稀疏性和长尾分布的影响。

未来规划包括优化SID的生产与表征方式，统一稀疏与密集表征，以及保证链路无损失实现一段式搜索。

🏷️