内容提要
AWS Glue是无服务器的数据集成服务,用于发现、准备和合并数据以进行分析、机器学习和应用程序开发。现在推出了Amazon Glue Data Quality自动监测功能的公开预览版,用于测量和监控数据质量。该功能简化了监控和评估数据质量的体验,不需要专业知识。可以使用AWS CloudFormation设置资源,并通过Amazon CloudWatch警报获取数据质量运行失败的通知。还可以通过Amazon Athena分析数据质量结果,并使用Amazon QuickSight构建控制面板表示数据质量趋势。
关键要点
-
AWS Glue是一项无服务器的数据集成服务,用于发现、准备和合并数据。
-
数据质量对于做出数据驱动型业务决策至关重要。
-
Amazon Glue Data Quality自动监测功能的公开预览版现已推出,简化了数据质量监控和评估的体验。
-
该功能不需要专业知识,用户可以轻松设置和使用。
-
可以使用AWS CloudFormation设置资源,并通过Amazon CloudWatch获取数据质量运行失败的通知。
-
用户可以通过Amazon Athena分析数据质量结果,并使用Amazon QuickSight构建控制面板。
-
文章系列的第一部分介绍了Amazon Glue Data Quality自动监测功能的工作原理。
-
用户可以生成数据质量规则建议,并根据建议运行数据质量任务。
-
Amazon Glue Data Quality自动监测功能会根据数据形态生成建议规则。
-
用户可以通过Amazon CloudWatch设置警报,以便在数据质量运行失败时收到通知。
-
可以通过API执行Amazon Glue Data Quality自动监测功能的步骤。
-
用户可以使用Amazon Athena分析数据质量结果,并构建数据质量趋势的控制面板。
-
文章最后提供了清理步骤,包括删除创建的表和警报。