用 Strands Agents SDK 构建确定性数据分析：语义层 + VQR 在 Amazon Bedrock 上的实践

亚马逊AWS官方博客 ·

用 Strands Agents SDK 构建确定性数据分析：语义层 + VQR 在 Amazon Bedrock 上的实践

💡 原文中文，约21000字，阅读约需50分钟。

📝

内容提要

本文介绍了一种基于Strands Agents SDK和Amazon Bedrock的确定性数据分析架构，旨在解决企业数据分析中自然语言生成SQL的挑战。该架构由语义层、VQR知识库和Agent层组成，确保高频查询的准确性和可复用性，降低LLM调用频率，从而优化成本和响应时间，强调在不需要时避免使用LLM，以提高效率和稳定性。

🎯

关键要点

企业数据分析中，LLM 直接生成 SQL 面临不可复现、不可审计、不可收敛三大挑战。
提出基于 Strands Agents SDK 和 Amazon Bedrock 的三层确定性架构：语义层、VQR 知识库和 Agent 层。
语义层将业务术语映射为标准 SQL 片段，确保高频查询的准确性和可复用性。
VQR 知识库通过反馈机制缓存验证查询，降低 LLM 调用频率，优化成本和响应时间。
强调在不需要时避免使用 LLM，以提高效率和稳定性。
系统运行越久，VQR 命中率越高，LLM 调用越少，成本与时延会形成持续优化飞轮。
三层架构设计的核心原则是：能不用 LLM 就不用，必须用 LLM 时尽量少用。
VQR 机制引入了知识积累维度，允许高频问题的查询成本逐渐降低。
VQR 适合处理已知且重复的问题，但不具备真正的语义理解与推理能力。
未来的演进方向是将 VQR 作为 LLM 的高质量参考输入，提升语义理解能力和回答效果。

❓

延伸问答

Strands Agents SDK 和 Amazon Bedrock 的结合有什么优势？

Strands Agents SDK 提供了代码优先的灵活性，适合深度定制的场景，而 Amazon Bedrock 提供了开箱即用的托管方案，两者结合可以在数据分析中实现高效的自然语言查询。

VQR 机制如何优化数据查询成本？

VQR 机制通过缓存已验证的查询，允许高频问题直接执行 SQL，避免了重复调用 LLM，从而降低了查询成本和响应时间。

三层确定性架构的核心原则是什么？

三层确定性架构的核心原则是：能不用 LLM 就不用，必须用 LLM 时尽量少用，以确保查询的准确性和效率。

语义层在数据分析中起什么作用？

语义层负责将业务术语映射为标准 SQL 片段，确保高频查询的准确性和可复用性，从而提高数据分析的可靠性。

企业在自然语言查询中面临哪些主要挑战？

企业在自然语言查询中面临的主要挑战包括 LLM 输出的概率性、缺乏业务语义理解和缺乏学习能力，导致查询结果不稳定。

VQR 机制的局限性是什么？

VQR 机制的局限性在于它不具备真正的语义理解与推理能力，无法处理字面相近但语义不同的问题。

🏷️

继续阅读

用 Amazon Quick 加速日常数据工作
Amazon Quick 是一款企业办公助手，利用自然语言处理技术提升数据处理效率。用户只需描述需求，Quick 即可自动分析、生成报告和执行工作流程，适...
教你薅token：构建agent无关的AI工作流
目前使用AI的主要痛点是高昂的账单。用户可以通过维护良好的文档来优化使用流程，减少对高价Agent的依赖。合理利用免费资源可以节省开支，维护好文档有助于降...
Claude Code动态工作流完全指南
本文介绍了Claude Code的动态工作流功能，旨在提高复杂任务的效率。动态工作流支持同时处理多个任务，避免效率低下和目标偏离。文章详细描述了七种工作流...
一夜之间，ChatGPT 变成了第二个 Claude
OpenAI计划将Codex整合进ChatGPT，以提升其在企业工作中的应用。Codex将支持数据分析、市场营销等多种任务，用户可通过统一界面操作。目前C...
让 Amazon Quick 操作飞书：构建远程 MCP 服务的设计实践
本文探讨了如何利用AWS Bedrock AgentCore构建Amazon Quick与飞书的远程MCP服务，提出了按需编排、分层注册和Token安全的...
读：DuckDB for Python Developers
DuckDB 是一个适用于 Python 开发者的嵌入式分析数据库，支持直接用 SQL 查询 CSV 和 Parquet 文件，无需加载到内存，安装简单。...