Blog on LlamaIndex ·

使用LlamaCloud进行动态检索

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

建立一个强大的问答助手需要动态地检索每个查询的最相关信息。对于有些问题，一个简短的片段就能提供完整的答案，而其他问题则需要整个文档的完整上下文（例如“给我这本书的摘要”）。对于属于后一类的问题，仅仅检索匹配的前k个块是不够的；你需要有意地检索整个文档文本，并将其输入到LLM的上下文窗口中。为了解决这个问题，我们很高兴发布LlamaCloud的文件级检索，这是一个独立的检索API，与我们现有的块级检索能力分开。这个检索接口为我们构建一个能够根据问题的属性动态路由问题到正确的检索接口的代理铺平了道路，从而使其能够更强大地处理不同的用户问题。文件级检索是一种检索整个文档内容的方法，例如整个SEC 10K文件或整个幻灯片。有两种主要的文件级检索方法：通过元数据选择文件，通过内容使用文档的内容确定最相关的文件。该接口允许您在检索模式之间无缝切换，并调整参数，如前k个结果，甚至在使用文件级检索时按元数据进行过滤。为了展示动态检索的能力，我们创建了一个Jupyter笔记本，指导您构建一个能够根据手头问题选择块级和文件级检索之间的代理。

🎯

关键要点

建立强大的问答助手需要动态检索最相关的信息。
有些问题只需简短片段回答，而其他问题需要整个文档的上下文。
为了解决文档级检索的需求，发布了LlamaCloud的文件级检索API。
文件级检索方法包括通过元数据选择文件和通过内容选择文件。
该接口允许在检索模式之间无缝切换，并调整参数。
创建了一个Jupyter笔记本，指导用户构建动态检索代理。
代理根据问题选择块级或文件级检索。
代理能够智能地决定使用文件级检索或块级检索。
LlamaCloud的动态检索能力为构建智能和上下文感知的LLM应用程序提供了重要进展。
鼓励用户探索LlamaCloud的新功能并尝试Jupyter笔记本。

➡️

继续阅读

Vibhor Kumar：平稳平台测试：您的PostgreSQL策略是否适合企业？
Features create capability. Calm operations create trust. Most platfor...
Rivian的收入增长，R2生产加速
Rivian在2026年第一季度销售了10,365辆电动车，同比增长20%，收入达13.8亿美元。公司计划推出更实惠的R2车型，预计年底销售20,000辆...
Rivian缩减其在乔治亚州电动车工厂的目标
Rivian宣布因与美国能源部的贷款协议调整，将乔治亚州电动车工厂的年产能力从40万辆减少至30万辆，新的贷款金额为45亿美元，低于原先的66亿美元。Ri...
Nemotron Labs: What OpenClaw Agents Mean for Every Organization
By early 2026, the open source project OpenClaw had become a phenomenon. In J...
种族歧视的最高法院逻辑不成立
美国最高法院裁定废除《投票权法》第2条，允许种族歧视的选区划分，导致黑人选民代表性大幅下降，进一步加剧社会不平等。
人工智能沙箱正迎来其Kubernetes时刻
Anthropic的新模型Mythos能够自主发现并利用操作系统和浏览器的零日漏洞，揭示了当前安全架构的缺陷。大多数安全产品仅生成日志，未能有效提高系统安...