The New Stack ·

你的智能代理想要像2010年的量化分析师一样进行搜索

💡 原文英文，约800词，阅读约需3分钟。

📝

内容提要

文章讨论了大型语言模型在信息检索中的发展历程。从最初效果不佳的向量数据库方法，到结合人类信息检索经验的混合搜索和机器学习排名，检索效果显著提升。当前，随着Perplexity推出“代码搜索”，搜索方式正在向更高阶段演进。文章强调，智能代理应具备更复杂的搜索能力，以提高检索结果的质量。

🎯

🔎

大型语言模型的信息检索经历了从简单的向量数据库到混合搜索的演变。最初的向量方法缺乏上下文，导致检索效果不佳。随着人类信息检索经验的结合，检索效果显著提升，显示出技术进步的重要性。

智能代理的搜索能力应超越普通用户，具备更复杂的查询能力。通过模拟专业分析师的搜索方式，代理可以更有效地获取信息，从而提高检索结果的质量。这一转变对未来的信息检索具有重要意义。

人类用户在搜索时常常表现出懒惰和无知，这影响了检索效果。智能代理则可以克服这些限制，进行更深入的查询和分析。理解用户行为的局限性，有助于开发更有效的搜索解决方案。

❓

大型语言模型的信息检索经历了向量数据库阶段、结合人类信息检索经验的混合搜索阶段，以及当前的代码搜索阶段。

最初的向量数据库方法效果不佳是因为缺乏上下文信息，且仅基于向量相似度评分无法可靠地提取有用信息。

混合搜索和机器学习排名结合了人类信息检索的经验，显著提高了检索效果，使许多用例从演示阶段进入生产质量。

Perplexity推出的“代码搜索”标志着信息检索方式的进一步发展，可能进入了信息检索的第三阶段。

智能代理应具备复杂的搜索能力，包括多种查询组合、获取概览、深入研究特定主题等，以提高检索结果的质量。

为人类设计搜索时，开发者需要考虑广泛的用例并进行权衡；而为智能代理设计时，重点是提供丰富的工具箱以满足多样的信息需求。

🏷️