小红花·文摘

该论文介绍了LinkedIn的大规模基于GPU的检索系统LiNR，支持十亿级索引。使用TensorFlow和PyTorch创建可扩展的可区分搜索索引的经验和挑战。LiNR将项目和模型权重集成到模型二进制文件中，并扩展系统以支持大规模索引。实现基于属性的预过滤用于GPU搜索，并解决KNN搜索中的后过滤挑战。提供多嵌入检索算法和策略解决冷启动问题。通过量化支持更大索引。应用LiNR在LinkedIn Feed的网络外推荐中，专业日活跃用户增加了3%。预期LiNR将检索和排序集成为单个GPU模型，简化基础设施并实现端到端优化。