PG是一个典型的c/s模型
体系结构=实例+存储结构
实例=进程+内存结构
<meta charset="utf-8">
实例结构
PG是多进程的,类似oracle,区别于MySQL的单进程多线程。
PostMaster进程(PM)处理连接层和部分SQL层相关的;
SP不光是处理连接,还处理会话中的SQL,包含两层功能;
BP是后台进程,比如ckpt,archive等等。
SGA共享内存区,功能类似buffer pool;
PGA私有内存区,为上面的SP分配区域。
进程结构
我们在OS上ps -ef |grep postgres能看到这些后台进程。
- PM进程:提供监听、连接协议、验证、fork其他进程。服务一启动就有。
监听哪个ip是受到postgressql.conf影响的,提供socket和TCP/IP方式连接。
验证功能是通过pg_hba.conf和用户验证模块。 - SP进程:会话进程,是真正的工作进程。
用户一旦验证成功就会fork一个新的进程。
然后完成整个SQL的预处理,语义语法检查,分析优化执行。
可理解为充当了MySQL中连接线程和SQL线程的作用。 - BGW进程:background writer,主要负责后台刷新脏页。
- sysloger进程:主要负责数据库状态信息的日志记录。
- ckpt进程:checkpoint,检查点。
- walwriter:WALW日志(就是他的redolog)的刷写进程。
- arch:归档进程
-AV:数据整理,因为堆表(heap table)和索引组织表不一样。
-SC:状态控制进程。
内存结构
存储结构
重点文件
日志文件种类
- $PGDATA/log:运行日志
- $PGDATA/pg_wal:重做日志
- $PGDATA/pg_xact:事务提交日志
- 服务器日志,可以在启动的时间指定
参数名 参数说明
log_destination = 'csvlog' 运行日志可以存储成各种格式 ,stderr,csvlog,syslog,and eventlog,csvlog requires logging_collector to be on,一般选择csvlog,可以导入数据库中查看
logging_collector = on 选csv格式的日志必须设置这个参数on才行,修改需要重启才生效
log_directory = 'log' 日志输出目录
log_filename = 'postgresql-%Y-%m-%d_%H%M%S.log' 日志文件名字的格式
log_file_mode=0600 日志文件权限
log_truncate_on_rotation = on 设置重用日志
log_rotation_age = 1d 多长时间重用日志
log_rotation_size = 10MB 日志达到多大重用
log_min_messages = warning 可选项由少到多分别有debug5,debug4,debug3,debug2,debug1,info,notice,warning,error,log,fatal,panic
log_min_duration_statement = 5 超过多长时间记录慢SQL
log_checkpoints = on 记录检查点操作
log_connections = on 记录会话连接操作
log_disconnections = on 记录会话断开操作
log_duration = on 记录SQL执行时间
log_lock_waits = on log lock waits >= deadlock_timeout记录时间长的阻塞
log_statement='ddl' none,ddl,mod,all 记录ddl
postgresql.conf
pg_hba.conf
防火墙
pg_ident.conf
用户映射配置文件。结合pg_hba.conf中,method为ident可以用特定的操作系统用户和指定的数据库用户登录数据库。
控制文件
pg_controldata可以查看控制文件的内容
数据文件
pg中,每个索引和表都是一个单独的文件,pg中叫做page。默认是每个大于1G的page会被分割pg_class.relfilenode.1这样的文件。page的大小在initdb的时候指定(--with-segsize).
page物理位置在$PGDATA.BASE/DATABASE_OID/PG_CLASS.RELFILENODE
查看t1表在哪个段上:
=# select relfilenode from pg_class where relname='t1';
查看对应的文件:
=# select pg_relation_filepath('t1');
查看数据目录:
=# show data_directory;
需要注意的是,pg_class.relfilenode类似dba_objects.data_object_id,truncate表之后relfilennode会变。对应的物理文件也会变。
Online WAL日志
目的是为了保证崩溃后的安全,如果系统崩溃,可以’重放‘从最后一次的检查点以来的日志项来恢复数据库的一致性。
设置
pg提供如下参数控制wal日志的大小
max_wal_size=1G
在自动wal检查点之间wal增长到的最大尺寸。这是个软限制,在特殊的情况下wal尺寸可能会超过max,例如在重负荷下,archive_command失败或者高的wal_keep_segments设置。如果指定值时没有单位,则以兆字节为单位。默认为1GB.增加这个参数,可能会导致崩溃恢复所需的时间。这个参数只能在postgresql.conf或者服务器命令行中设置。
min_wal_size=80MB
只要wal磁盘用量保持在这个设置之下,在检查点时旧的wal文件总是被回收以便未来使用,而不是直接删除。这可以被用来确保有足够的wal空间来应付wal使用的高峰,例如运行大型的批处理任务。如果指定值时没有单位,则以兆字节为单位,默认时80MB.这个参数只能在postgresql.conf或者服务器命令行中设置。
位置
wal在$PGDATA/pg_wal下,10之前为pg_xlog
命名格式
为16进制的24个字符组成,每8个字符一组,每组的意义如下:
00000001 00000000 00000001
------------ ------------- ------------
时间线 逻辑id 物理id
查看wal时间
select pg_walfile_name(pg_current_wal_lsn());
select * from pg_ls_waldir() order by modification asc;
日志切换
切换正在使用的
select pg_switch_wal():
pg_waldump查看wal的具体内容
归档日志
在生产环境,为了保证数据高可用性,通常需要设置归档,所谓的归档,就是把pg_wal里面的日志备份出来,当系统故障后通过归档的日志文件对数据进行恢复。配置归档需要开启一下参数:
wal_level=replice(13默认开启)
可选的值minimal,replica,logical,wal的级别依次增高,在wal的信息也越来越多。由于
minimal这一等级的wal不包含从基础的备份和wal日志重建数据的足够信息,在该模式下,无法开启wal日志归档。
archive_mode=on
打开归档备份,可选的参数有on off always 默认off
archive_command= 'test ! -f /mnt/server/archivedir/%f && cp %p /mnt/server/archivedir/%f'
默认值是一个空字符串,他的值可以是一条shell命令或者一个复杂的shell脚本。
在脚本或命令中可以使用“%p”表示将要归档的wal文件包含完整路径的信息的文件名,
用“%f”表示不包含路径信息的wal文件的文件名
wal_level,archive_mode参数修改都需要重启数据库才可以生效,而archive_command不需要,所以一般配置新系统建议两个参数都要开启哦!!