外部数据包装器(FDW)使远程Postgres表可作为本地表使用,但性能常常不尽如人意。查询可能表现得像分布式系统,数据的移动和往返次数会影响性能。推送机制决定了查询是否在数据源处进行过滤、连接和聚合,成功的推送可以减少数据传输,提高查询效率。手册提供FDW的基本知识、调优方法和案例研究,帮助用户优化查询性能。
发布了新的PostgreSQL外部数据包装器sparql_fdw,支持通过SPARQL协议连接网络数据库。经过测试,sparql_fdw在PostgreSQL 18上运行良好,README文件已更新以支持该版本,同时移除了对PostgreSQL 12的支持。
Cal.com推出外部数据包装器,用户可直接从Postgres创建事件预订,支持在单个事务中同时创建事件和预订,适用于个人和企业日程管理。用户可通过外部表查询事件类型和预订信息,并在Postgres中插入预订记录。
外部数据包装器(FDWs)是PostgreSQL的扩展,简化了跨数据库查询,允许用户在不迁移数据的情况下直接从不同PostgreSQL数据库获取信息,适合微服务架构和实时分析。FDWs减少了ETL过程的复杂性,提高了数据整合和实时分析的效率,使开发者能更专注于洞察而非基础设施管理。
外部数据包装器(FDW)是数据库管理系统中的功能,允许在不移动数据的情况下访问外部数据源。PostgreSQL实现了SQL/MED规范,通过常规SQL查询实现对外部数据的访问。文章讨论了PostgreSQL中的两个FDW:dblink和postgres_fdw。dblink用于管理数据库会话和在远程数据库中执行查询,而postgres_fdw提供更好的性能并使用更现代的基础架构。文章还解释了使用dblink和postgres_fdw设置和访问远程数据库的步骤。文章以限制和提到Percona Distribution for PostgreSQL作为可靠的解决方案。
本文讨论了如何使用pgvector在PostgreSQL中运行分布式查询。它探讨了使用分区和外部数据包装器将数据分割和分布到多个实例的方法。文章提供了示例和测试来证明分布式pgvector查询的可行性和性能。文章得出结论,当单个实例不足时,将工作负载分布到多个数据库可以是可扩展的解决方案。然而,在简化和扩展pgvector跨多个可写实例方面仍有改进空间。
本文介绍了Postgres开源数据库的工作和PgLife监控功能。Postgres在现代工作负载方面表现出色,但无法处理大数据量和写入密集型工作负载。为了解决这些问题,Postgres开发社区改进了分区、并行处理和外部数据包装器等功能,以实现分片。作者对Fujii-san的补丁表示了希望,认为它能够在Postgres 17中实现对外部表进行部分聚合的并行处理。
作者将在2023年5月30日至6月2日在渥太华举行的PGCon 2023上演讲,主题是编写外部数据包装器。这是PostgreSQL的技术/黑客会议,欢迎参加。
完成下面两步后,将自动完成登录并继续当前操作。