数据库的历史变更会持久化到事务日志文件中,本节简单介绍了PG中事务日志文件的体系结构(以下简称WAL文件结构)。
一、WAL文件结构
PG使用无符号64bit整型(uint64)作为日志文件的寻址空间,理论上来说,如果只有一个日志文件,那么这个事务日志文件的大小最大为2^64Bytes(即16M*1TB=16EB)。为了高效管理事务日志文件,PG把日志文件划分为N个大小为16M(默认值)的WAL segment file.
总体结构如下图所示:
WAL segment file
WAL segment file文件长度为24,由3部分组成,每个部分是8个16进制数字:
1.第1部分是TimeLineID,0x00000000 -> 0xFFFFFFFF
2.第2部分是逻辑文件ID,0x00000000 -> 0xFFFFFFFF
3.第3部分是物理文件ID,0x00000000 -> 0x000000FF
逻辑文件ID占32bit,物理文件ID占8bit,16M的文件占24bit,合计64bit.PG通过这三部分的组合,达到最大64bit的文件寻址空间.
文件存储目录
事务日志文件存储在$PGDATA/pg_wal目录下
二、LSN
LSN:Logical Sequence Number,XLOG record中的LSN表示该记录写入到事务日志中位置,大小为uint64.在PG中可以理解为事务日志文件中的偏移(Offset).
LSN由3部分组成,分别是逻辑文件ID,物理文件ID和文件内偏移.如LSN号1/4288E228,其中1为逻辑文件ID,42为物理文件ID,88E228为WAL segment file文件内偏移.
按此规则,给定一个LSN,很容易得到其对应的日志文件(假定时间线为1):
LSN-1/4288E228 --> WAL segment file:00000001 00000001 00000042
PG也提供了相应的函数根据LSN获取日志文件名:
testdb=# SELECT pg_walfile_name('1/4288E228');
pg_walfile_name
--------------------------
000000010000000100000042
(1 row)