Databricks ·

基于查询标签的dbt管道细粒度使用归属

💡 原文英文，约1000词，阅读约需4分钟。

📝

内容提要

本文介绍了如何通过Query Tags优化dbt模型的成本归属和性能调试。数据团队可以使用自动注入的标签轻松追踪查询执行情况，并通过配置自定义标签以便于监控和分析。示例项目展示了如何利用Query Tags构建成本分析仪表板，提升FinOps实践的效率。

🎯

🔎

Query Tags通过自动注入和自定义标签，极大地提升了数据团队对查询执行情况的追踪能力。这种细粒度的监控不仅有助于成本归属，还能优化性能调试，确保团队能够快速识别和解决问题。

通过配置Query Tags，数据团队可以轻松构建成本分析仪表板，提升FinOps实践的效率。这种方法使得团队能够实时监控和分析成本，避免了手动日志分析的繁琐，提升了工作效率。

尽管Query Tags提供了强大的追踪能力，但依赖于自动注入的标签可能会导致信息过载，尤其是在大型项目中。团队需要合理配置和管理标签，以确保数据的可读性和有效性。

❓

Query Tags是自动注入的标签，帮助数据团队追踪查询执行情况，优化成本归属和性能调试。

用户可以通过配置query_tags字段，使所有查询自动继承标签，从而进行更细粒度的成本分析。

Query Tags简化了使用归属分析的过程，无需手动日志分析，提升了成本监控和分析的效率。

用户可以自定义标签，如团队、成本中心和环境等，附加到每个查询中，以便于监控和分析。

Query Tags记录在system.query.history中，用户可以通过简单的SQL查询进行访问。

dbt-databricks适配器（版本1.11及以上）原生支持Query Tags，自动注入每次模型执行的元数据。

🏷️