PostgreSQL 数据库跨版本升级常用方案
作者: 不剪发的Tony老师
毕业于北京航空航天大学,十多年数据库管理与开发经验,目前在一家全球性的金融公司从事数据库架构设计。CSDN学院签约讲师以及GitChat专栏作者。csdn上的博客收藏于以下地址:https://tonydong.blog.csdn.net
文章目录
升级方案概述
通过逻辑备份与还原进行升级
利用 pg_upgrade 工具进行升级
使用逻辑复制功能进行升级
总结
大家好,我是只谈技术不剪发的 Tony 老师。对于企业而言,将数据库系统升级到新版本通常可以获得更好的性能、更多的功能、最新的安全补丁和错误修复等。因此,本文就来介绍一下 PostgreSQL 数据库版本升级的 3 种常用方案。
如果觉得文章有用,欢迎评论📝、点赞👍、推荐🎁
升级方案概述
PostgreSQL 版本号由主要版本和次要版本组成。例如,PostgreSQL 12.4 中的 12 是主要版本,4 是次要版本;PostgreSQL 10.0 之前的版本由 3 个数字组成,例如 9.6.19,其中 9.6 是主要版本,19 是次要版本。
发布次要版本是不会改变内存的存储格式,因此总是和相同的主要版本兼容。例如,PostgreSQL 12.4 和 PostgreSQL 12.0 以及后续的 PostgreSQL 12.x 兼容。对于这些兼容版本的升级非常简单,只需要关闭数据库服务,安装替换二进制的可执行文件,重新启动服务即可。
接下来,我们主要讨论 PostgreSQL 的跨版本升级问题,例如从 PostgreSQL 12.x 升级到 PostgreSQL 13.y。主要版本的升级可能会修改内部数据的存储格式,因此需要执行额外的操作。常用的跨版本升级方法和适用场景如下:
📝如果使用厂商提供的 PostgreSQL 定制版本,也可能通过他们提供的工具实现版本升级,具体参考相关文档。
注意事项:升级主要版本通过会导致用户可见的不兼容性,因此应用程序可能需要进行相应的修改。具体的变化可以参考发行说明,尤其是“Migration”部分的内容;如果跨多个主要版本进行升级,需要阅读每个中间版本的发行说明。
通过逻辑备份与还原进行升级
传统的跨版本升级方法利用 pg_dump/pg_dumpall 逻辑备份导出数据库,然后在新版本中通过 pg_restore 进行还原。导出旧版本数据库时推荐使用新版本的 pg_dump/pg_dumpall 工具,可以利用最新的并行导出和还原功能,同时可以减少数据库膨胀问题。
逻辑备份与还原非常简单但速度比较慢,停机时间取决于数据库的大小,因此适合中小型数据库的升级。
下面我们介绍这种升级方法的具体操作,假如当前 PostgreSQL 软件的安装目录位于 /usr/local/pgsql,同时数据目录位于 /usr/local/pgsql/data,我们在同一台服务器上进行升级。
执行逻辑备份之前停止应用程序,确保没有数据更新,因为备份开始后的更新不会被导出。如有必要,可以修改 /usr/local/pgsql/data/pg_hba.conf 文件禁止其他人访问数据库。
然后备份数据库:
pg_dumpall > outputfile
如果已经安装了新版本的 PostgreSQL,可以使用新版本的 pg_dumpall 命令备份旧版本数据库。
停止旧版本的后台服务:
pg_ctl stop
或者通过其他方式停止后台服务。
如果安装目录没有包含特定版本标识,可以将目录改名,必要时可以再修改回来。可以使用类似以下的命令重命名目录:
mv /usr/local/pgsql /usr/local/pgsql.old
安装新版本 PostgreSQL 软件,假如安装目录仍然是 /usr/local/pgsql。
初始化一个新的数据库集群,需要使用数据库专用用户(通常是 postgres;如果是升级版本,应该已经存在该用户)执行操作:
/usr/local/pgsql/bin/initdb -D /usr/local/pgsql/data
将旧版本配置文件 pg_hba.conf 和 postgresql.conf 等中的改动在对应的新配置文件中再次进行修改。
使用数据库专用用户启动新版本的后台服务:
/usr/local/pgsql/bin/postgres -D /usr/local/pgsql/data
最后,利用新版本的 psql 命令还原数据:
/usr/local/pgsql/bin/psql -d postgres -f outputfile
为了减少停机时间,可以将新版本的 PostgreSQL 安装到另一个目录(例如 /usr/local/pgsql-13),同时使用不同的端口启动服务。然后同时执行数据库的导出和导入:
pg_dumpall -p 5432 | psql -d postgres -p 5433
执行以上操作时,新旧版本的后台服务同时运行,新版本使用 5433 端口,旧版本使用 5432 端口。
利用 pg_upgrade 工具进行升级
pg_upgrade 工具可以支持 PostgreSQL 跨版本的就地升级,不需要执行导出和导入操作。pg_upgrade 可以支持 PostgreSQL 8.4.X 到最新版本的升级,包括快照版本和测试版本。
pg_upgrade 提供了升级前的兼容性检查(-c 或者 --check 选项)功能, 可以发现插件、数据类型不兼容等问题。如果指定了 --link 选项,新版本服务可以直接使用原有的数据库文件而不需要执行复制,通常可以在几分钟内完成升级操作。
下面我们介绍这种升级方法的具体操作,假如当前 PostgreSQL 软件的安装目录位于 /usr/pgsql-12/,同时数据目录位于 /var/lib/pgsql/12/data/,我们将其升级为 PostgreSQL 13。
确定没有客户端访问之后备份数据库,然后停止旧版本的后台服务。例如 CentOS 可以执行以下命令:
sudo systemctl stop postgresql-12
sudo systemctl disable postgresql-12
安装新版本的 PostgreSQL 软件。例如 PostgreSQL 13.0,安装目录位于 /usr/pgsql-13/。
初始化新版本的数据库集群。数据目录设置为 /var/lib/pgsql/13/data/。
如果旧版本中安装了扩展模块,在新版本中也需要安装相应的共享对象文件或者 DLL 文件。但是不要执行CREATE EXTENSION命令,因为会从旧数据库中进行升级。另外,如果使用了任何自定义的全文搜索文件(字典、同义词、词库、停用词),也需要复制到新的数据库集群目录中。
停止新版本的后台服务。例如 CentOS 可以执行以下命令:
sudo systemctl stop postgresql-13
通过 pg_upgrade 执行升级操作,使用数据库专用用户(通常是 postgres)执行以下操作:
/usr/pgsql-13/bin/pg_upgrade \
--old-datadir /var/lib/pgsql/12/data/ \
--new-datadir /var/lib/pgsql/13/data/ \
--old-bindir /usr/pgsql-12/bin/ \
--new-bindir /usr/pgsql-13/bin/ \
--check
其中 --check 表示执行升级检查,而不会真的执行升级操作。通过检查之后,可以去掉该参数执行升级:
/usr/pgsql-13/bin/pg_upgrade \
--old-datadir /var/lib/pgsql/12/data/ \
--new-datadir /var/lib/pgsql/13/data/ \
--old-bindir /usr/pgsql-12/bin/ \
--new-bindir /usr/pgsql-13/bin/ \
--link
其中 --link 表示将新版本的数据目录硬链接到旧版本的数据目录,而不会复制一份新的数据文件,可以快速进行升级。
将旧版本配置文件 pg_hba.conf 和 postgresql.conf 等中的改动在对应的新配置文件中再次进行修改。
启动新版本的后台服务。例如 CentOS 可以执行以下命令:
sudo systemctl start postgresql-13
sudo systemctl enable postgresql-13
连接服务器查看数据库的版本信息:
SELECT version();
version |
-------------------------------------------------------------------------------------------------------|
PostgreSQL 13.0 on x86_64-pc-linux-gnu, compiled by gcc (GCC) 4.8.5 20150623 (Red Hat 4.8.5-39), 64-bit|
收集统计信息。pg_upgrade 不会生成新版本数据库的统计信息,但是会创建一个脚本文件,执行该文件:
./analyze_new_cluster.sh
如果确认升级成功,可以选择删除或者保留旧的数据库软件和集群。pg_upgrade 同样提供了一个删除旧数据库集群的脚本:
./delete_old_cluster.sh
然后可以删除旧版本的 PostgreSQL 软件,例如 CentOS 可以执行以下命令:
yum remove postgresql12*
如果想要回退到旧版本的数据库,可以分为不同的情况:
如果只运行了 --check 选项命令,表示没有真正执行升级,重新启动服务即可;
如果升级时没有使用 --link 选项,旧版本的数据库集群没有任何修改,重新启动服务即可;
如果升级时使用了 --link 选项,数据库文件可能已经被新版本的集群使用:
如果 pg_upgrade 在链接操作之前终止,旧版本的数据库集群没有任何修改,重新启动服务即可;
如果没有启动过新版本的后台服务,旧版本的数据库集群没有修改,但是链接过程已经将
$PGDATA/global/pg_control 文件重命名为
$PGDATA/global/pg_control.old;此时需要将该文件名中的 .old 后缀去掉,然后重新启动服务即可;
如果已经启动了新版本的数据库集群,已经修改了数据库文件,再启动旧版本的服务可能导致数据损坏;此时需要通过备份文件还原旧版本的数据库。
关于 pg_upgrade 的详细使用和升级注意事项,例如流复制结构和日志传输复制结构中备用节点的升级,可以参考官方文档。
使用逻辑复制功能进行升级
PostgreSQL 逻辑复制支持跨版本之间的数据复制,而且支持不同平台之间的复制,因此也可以用于实现版本升级。我们可以安装一个新版本的数据库作为复制的从节点,当数据已经同步时执行一次主从切换,然后关闭旧版本的主节点。主从切换的升级方法通常只需要几秒钟就能完成,利用第三方高可用组件甚至可以实现零停机时间升级。
PostgreSQL 10 开始提供了内置的逻辑复制功能,或者也可以使用 pglogical、Slony、Londiste 以及 Bucardo 等逻辑复杂工具。
关于 PostgreSQL 逻辑复制结构的创建和主从切换,可以参考官方文档。
总结
PostgreSQL 小版本升级只需要替换二进制文件即可,跨版本升级的方案主要有 3 种:通过 pg_dump/pg_dumpall
逻辑备份与还原进行升级,利用 pg_upgrade
工具进行升级,使用逻辑复制功能进行升级。了解它们的优缺点和适用场景可以帮助我们选择最佳的升级方式。