AWS Athena

AWS Athena

💡 原文英文,约500词,阅读约需2分钟。
📝

内容提要

Amazon Athena 是一种无服务器的交互式数据分析工具,能够高效处理存储在 Amazon S3 中的数据,支持标准 SQL 查询,用户仅需为执行的查询付费,并通过 AWS Glue 管理元数据。

🎯

关键要点

  • Amazon Athena 是一种无服务器的交互式数据分析工具,能够高效处理复杂查询。
  • Athena 通过将查询分解为简单组件并并行执行来提高效率。
  • 用户仅需为执行的查询付费,无需担心基础设施的设置和管理。
  • Athena 不是数据库服务,用户只需指向存储在 Amazon S3 的数据并定义必要的模式。
  • Athena 支持分析存储在 S3 中的非结构化、半结构化和结构化数据。
  • AWS Glue 通过爬虫帮助组织 Amazon S3 数据,以便使用 Athena 进行查询。
  • 爬虫会生成数据目录中的表定义,便于管理元数据。
  • 数据目录是 AWS Glue 中的长期元数据存储,保存表定义和作业定义。
  • 工作组功能使用户能够管理查询历史,保持查询的独立性。
  • Athena 查询结果和元数据存储在 S3 中,避免重复数据扫描。
  • Athena 的定价模型为每扫描 1TB 数据收费 5 美元,最低收费为每个查询 10MB。
  • 使用分区可以优化成本,减少扫描的数据量。
➡️

继续阅读