Planet PostgreSQL ·

彼得·艾森特劳特：在PostgreSQL中实现线程安全的扫描器和解析器

💡 原文英文，约5800词，阅读约需21分钟。

📝

内容提要

本文探讨了如何在PostgreSQL中实现扫描器和解析器的线程安全，记录了在此过程中遇到的挑战及解决方案，包括使用Flex和Bison的可重入和纯函数选项。通过调整代码结构和参数传递，确保了多线程环境下的安全性，并总结了关键步骤和经验教训。

🎯

关键要点

本文探讨了在PostgreSQL中实现扫描器和解析器的线程安全。
使用Flex和Bison的可重入和纯函数选项来解决线程安全问题。
调整代码结构和参数传递以确保多线程环境下的安全性。
PostgreSQL的扫描器和解析器有多种类型，具有不同的要求和复杂性。
通过使用%option reentrant选项使扫描器可重入，允许多个扫描器实例并行运行。
使用%define api.pure full选项使解析器成为纯函数，避免使用全局变量。
通过%parse-param和%lex-param传递上下文信息到解析器和扫描器。
在处理额外的扫描器状态时，使用结构体而不是全局变量来保持线程安全。
通过将解析结果作为参数传递给yyparse()，避免使用全局变量来存储解析结果。
总结了一些实现线程安全的经验教训和最佳实践。

❓

延伸问答

如何在PostgreSQL中实现线程安全的扫描器和解析器？

通过使用Flex和Bison的可重入和纯函数选项，并调整代码结构和参数传递来实现线程安全。

Flex和Bison的可重入选项有什么作用？

Flex的可重入选项允许多个扫描器实例并行运行，而Bison的纯函数选项避免使用全局变量，确保线程安全。

在多线程环境中，如何确保扫描器和解析器的安全性？

通过使用结构体而不是全局变量来存储状态，并通过%parse-param和%lex-param传递上下文信息。

PostgreSQL中有多少种扫描器和解析器？

PostgreSQL中包含13个扫描器文件和10个解析器文件，处理不同的语言和配置。

如何避免在解析过程中使用全局变量？

通过将解析结果作为参数传递给yyparse()，并使用局部变量来存储状态，避免全局变量的使用。

在实现线程安全的扫描器时，如何处理额外的状态？

使用结构体来存储额外的状态，并在扫描器初始化时分配内存以确保线程安全。

🏷️

继续阅读

Stefan Fercot：pgBackRest与pg_tde兼容吗？
Percona的pg_tde扩展为PostgreSQL提供透明数据加密（TDE），保护静态数据，并通过OpenBao管理加密密钥。测试显示，pgBackR...
AI对话开发需要自建吗?还是选开源好
在AI对话系统开发中，选择自建还是开源框架需综合考虑成本、周期和团队能力。自建系统提供完全掌控，但成本高、周期长；开源框架启动快，但灵活性受限。理想选择是...
Galaxea G0.5——升级“VLA自回归建模”范式：摒弃VLM上添加动作专家的模式，而是构建统一模型，用一套权重，在同一个自回归token序列中同时生成推理与动作(含VLA-0的详解)
星海图提出的G0.5模型将视觉语言模型与动作生成统一为单一自回归序列，通过共享权重实现推理与动作的耦合，提升机器人控制效率。该模型采用可学习的动作分词器和...
江波龙携全栈端侧AI存储应用参加COMPUTEX 2026
江波龙在COMPUTEX 2026展会上展示了全栈端侧AI存储新品，包括针对AI推理的AIDIMM和AILPBGA内存产品，解决了内存容量不足的问题。同时...
技嘉科技在COMPUTEX 2026发布新一代电竞外设产品
技嘉科技在COMPUTEX 2026发布了新一代电竞外设，包括AORUS K10 INFINITY键盘和AORUS M10 INFINITY鼠标。键盘采用...
忆联中标中国移动SSD AVAP项目，总容量第一
忆联中标中国移动SSD AVAP项目，成为第一成交候选人，获得总容量第一。中标产品包括UH8系列PCIe Gen5 SSD和UM3系列SATA eSSD，...