Andreas 'ads' Scherbaum:PGSQL 星期五 011 - PostgreSQL 中的分区与分片

💡 原文英文,约900词,阅读约需3分钟。
📝

内容提要

本文讨论了在业务问题中使用分区还是分片的选择。作者介绍了Adjust公司使用的四个主要数据库系统及其功能。他们同时使用分片和分区来处理大量数据和提高读写速度。

🎯

关键要点

  • 本文讨论了在业务问题中使用分区和分片的选择。
  • Adjust公司使用四个主要数据库系统:Backend、Shards、Bagger和Tracker。
  • Backend系统用于中间数据存储,数据可以在数小时到数周内更新。
  • Shards作为长期存储系统,每个Shard大约有14 TB的数据。
  • Sharding过程涉及在现有和新Shard之间重新分配数据。
  • 每个Shard上的一些表也进行了分区,数据量不同。
  • Backend系统的大小约为15 TB,频繁更新的表进行了分区。
  • Bagger系统用于临时存储所有传入的网络请求,数据保留几天到一个月。
  • Tracker数据库专门用于跟踪Tracker ID,大小约为30 TB,部分表进行了分区。
  • 由于数据库数量庞大,使用分片是必要的,以便在多个服务器上存储数据。
  • 在每个分片系统上还使用分区来加速读写操作。
  • 对于Adjust公司来说,分片和分区是相辅相成的,而不是单独选择其一。
➡️

继续阅读