从 AWS Glue 数据目录开始使用 Amazon Glue Data Quality 功能

从 AWS Glue 数据目录开始使用 Amazon Glue Data Quality 功能

💡 原文中文,约9800字,阅读约需24分钟。
📝

内容提要

AWS Glue是无服务器的数据集成服务,用于发现、准备和合并数据以进行分析、机器学习和应用程序开发。现在推出了Amazon Glue Data Quality自动监测功能的公开预览版,用于测量和监控数据质量。该功能简化了监控和评估数据质量的体验,不需要专业知识。可以使用AWS CloudFormation设置资源,并通过Amazon CloudWatch警报获取数据质量运行失败的通知。还可以通过Amazon Athena分析数据质量结果,并使用Amazon QuickSight构建控制面板表示数据质量趋势。

🎯

关键要点

  • AWS Glue是一项无服务器的数据集成服务,用于发现、准备和合并数据。

  • 数据质量对于做出数据驱动型业务决策至关重要。

  • Amazon Glue Data Quality自动监测功能的公开预览版现已推出,简化了数据质量监控和评估的体验。

  • 该功能不需要专业知识,用户可以轻松设置和使用。

  • 可以使用AWS CloudFormation设置资源,并通过Amazon CloudWatch获取数据质量运行失败的通知。

  • 用户可以通过Amazon Athena分析数据质量结果,并使用Amazon QuickSight构建控制面板。

  • 文章系列的第一部分介绍了Amazon Glue Data Quality自动监测功能的工作原理。

  • 用户可以生成数据质量规则建议,并根据建议运行数据质量任务。

  • Amazon Glue Data Quality自动监测功能会根据数据形态生成建议规则。

  • 用户可以通过Amazon CloudWatch设置警报,以便在数据质量运行失败时收到通知。

  • 可以通过API执行Amazon Glue Data Quality自动监测功能的步骤。

  • 用户可以使用Amazon Athena分析数据质量结果,并构建数据质量趋势的控制面板。

  • 文章最后提供了清理步骤,包括删除创建的表和警报。

🏷️

标签

➡️

继续阅读