PostgreSQL支持GB18030作为客户端编码,但目前仅支持GB18030-2000标准。自2023年8月1日起,中国已强制实施GB18030-2022标准,二者存在不兼容性。HighGo已提交补丁以支持新标准,预计在2025年9月合并到PostgreSQL 19版本中。新标准对18个汉字进行了修改,但影响有限。
思源简体字库符合GB18030标准,能显示几乎所有繁体字,而思源繁体字库因只支持台湾CNS11643标准,无法显示许多简体字。简体字库支持大陆2000年标准,繁体字库支持台湾1986年标准。为兼容简繁体,建议使用符合GB18030的简体字库。文章列出思源繁体中缺少的1898个常用简体字。
ISO-8859-1是单字节编码,兼容ASCII。Unicode为每个字符分配唯一数字,可在不同平台、程序和语言中使用。GB18030是变长多字节字符集,编码空间大,可容纳161万个字符。
微软昨天发布Windows 11 Dev Build 23419 , 原本还以为本周没有Windows 11 […]
本文讨论了在Python 2和3中处理中文编码的zip文件的方法。在Python 2中,通过将文件名解码为unicode来处理中文;在Python 3中,根据语言编码标志(EFS)选择解码方式,通常使用gb18030。建议将所有文件名连接起来以提高编码猜测的准确性。
完成下面两步后,将自动完成登录并继续当前操作。