Andreas 'ads' Scherbaum:PGSQL 星期五 011 - PostgreSQL 中的分区与分片
💡
原文英文,约900词,阅读约需3分钟。
📝
内容提要
本文讨论了在业务问题中使用分区还是分片的选择。作者介绍了Adjust公司使用的四个主要数据库系统及其功能。他们同时使用分片和分区来处理大量数据和提高读写速度。
🎯
关键要点
- 本文讨论了在业务问题中使用分区和分片的选择。
- Adjust公司使用四个主要数据库系统:Backend、Shards、Bagger和Tracker。
- Backend系统用于中间数据存储,数据可以在数小时到数周内更新。
- Shards作为长期存储系统,每个Shard大约有14 TB的数据。
- Sharding过程涉及在现有和新Shard之间重新分配数据。
- 每个Shard上的一些表也进行了分区,数据量不同。
- Backend系统的大小约为15 TB,频繁更新的表进行了分区。
- Bagger系统用于临时存储所有传入的网络请求,数据保留几天到一个月。
- Tracker数据库专门用于跟踪Tracker ID,大小约为30 TB,部分表进行了分区。
- 由于数据库数量庞大,使用分片是必要的,以便在多个服务器上存储数据。
- 在每个分片系统上还使用分区来加速读写操作。
- 对于Adjust公司来说,分片和分区是相辅相成的,而不是单独选择其一。
➡️