OpenAI将单主PostgreSQL扩展至每秒数百万个查询以支持ChatGPT

InfoQ ·

OpenAI将单主PostgreSQL扩展至每秒数百万个查询以支持ChatGPT

💡 原文英文，约600词，阅读约需2分钟。

📝

内容提要

OpenAI优化了PostgreSQL，以支持ChatGPT和API平台，能够处理每秒数百万个查询，服务8亿用户。通过与Azure合作，提升了单主实例性能，减少写入压力，并采用分布式系统处理写重负载，确保低延迟和稳定性。

🎯

关键要点

OpenAI优化了PostgreSQL，以支持ChatGPT和API平台，能够处理每秒数百万个查询，服务8亿用户。
与Azure合作，提升了单主实例性能，减少写入压力，采用分布式系统处理写重负载。
优化措施包括扩大实例规模、优化查询模式和增加读取副本。
通过应用级调优减少冗余写入，将新的写重负载导向分片系统如Azure Cosmos DB。
主PostgreSQL实例由近50个地理分布的读取副本支持，确保低延迟。
在流量增加时，OpenAI识别出缓存未命中、ORM生成的多表连接模式等常见故障模式。
通过将一些计算移至应用层和严格控制事务超时来应对操作挑战。
减少写入压力是关键策略，通过迁移可分片工作负载到分布式系统来减轻PostgreSQL的负担。
使用PgBouncer管理PostgreSQL的连接池，减少连接设置延迟。
OpenAI正在实验级联复制，以减少主实例的负载并支持未来增长。
OpenAI继续评估扩展PostgreSQL可扩展性的方法，包括分片部署和替代分布式系统。

❓

延伸问答

OpenAI如何优化PostgreSQL以支持ChatGPT？

OpenAI通过与Azure合作，扩大实例规模、优化查询模式和增加读取副本，减少写入压力，支持每秒数百万个查询。

OpenAI在处理写重负载时采取了哪些策略？

OpenAI将新的写重负载导向分片系统如Azure Cosmos DB，并通过应用级调优减少冗余写入。

OpenAI如何确保PostgreSQL的低延迟和稳定性？

通过近50个地理分布的读取副本和优化的查询模式，OpenAI确保了低延迟和稳定性。

在流量增加时，OpenAI识别了哪些常见故障模式？

OpenAI识别出缓存未命中、ORM生成的多表连接模式等常见故障模式。

PgBouncer在OpenAI的PostgreSQL优化中起到了什么作用？

PgBouncer用于管理PostgreSQL的连接池，减少连接设置延迟，防止客户端连接激增。

OpenAI在扩展PostgreSQL可扩展性方面有哪些未来计划？

OpenAI正在评估分片部署和替代分布式系统，以平衡强一致性和不断增长的全球流量。

🏷️

继续阅读

科尔内利亚·比亚奇克斯：2026年第15周的贡献
2026年4月，多个PostgreSQL用户组在伦敦、旧金山湾区和巴塞罗那举行会议，演讲者包括Arun Kumar和Marcelo Díaz。Jesús ...
【Linux 网络子系统深度拆解】UDP 内核实现与 socket lookup 优化
本文深入探讨了UDP协议的内核实现，分析了其五个核心机制：socket查找优化、接收与发送路径、UDP GRO聚合、批量收发和UDP封装支持。UDP的轻量...
【Linux 网络子系统深度拆解】TCP 内核实现（下）：数据传输与拥塞控制
本文探讨了TCP数据传输与拥塞控制的内核实现，分析了发送路径和ACK处理机制。TCP通过发送缓冲区、拥塞窗口和接收窗口管理数据流，使用Nagle算法和TC...
【Linux 网络子系统深度拆解】IP 层内核实现：路由查找、分片与转发
本文深入探讨了Linux内核中IP层的路由机制，分析了FIB的LC-trie数据结构、策略路由的ip rule机制、Netfilter钩子的调用位置及性能...
【Linux 网络子系统深度拆解】sk_buff 全解：内核网络包的终极容器
本文深入解析了 Linux 内核中的 sk_buff 数据结构，探讨其内存布局、指针操作、克隆机制及分片机制。sk_buff 是网络栈中每个网络包的元数据...
Linux 网络子系统深度拆解
本文深入解析Linux内核网络子系统，基于6.6 LTS源码，探讨sk_buff、NAPI、softirq等关键组件的功能与实现，涵盖网络包的收发路径、协...