1、总结mysql常见的存储引擎以及特点。
存储引擎:负责把具体SQL语句的结果完成对磁盘上文件路径访问的转换,数据库中的行数据都是存放在磁盘块(page页)上,因此存储引擎要把数据库数据映射为磁盘块,并把磁盘块加载到内存中。进程在进行数据处理时,没有权限直接访问磁盘中的数据,只有让内核加载所需数据至内存中后,进程再在内存中完成修改,再由内核负责把数据存回磁盘。对于文件系统而言,数据的存储都是以磁盘块的方式存储的,多个磁盘块组成更大一级的逻辑单位,而不依赖于磁盘本身的数据块。存储引擎在实现数据处理时,在文件系统之上部署文件格式,对于文件而言在逻辑层上会组织一个逻辑单位,这个逻辑单位叫数据页,大小为16K,是最小分配单位。对于关系型数据库而言,一般一行数据都是存储在一起的,一个数据页可能存放若干条行数据,将来在查询数据时,内核会把整个数据页加载至内存中,而存储引擎就会从中挑选出一行来返回给查询者。
常见存储引擎总结:
MYISAM:MYSQL的经典存储引擎之一,是MySQL5.5.5之前默认的存储引擎,其特点是存储数据量大,读取数据较快,占用资源少。但不支持事务,不支持数据缓存,只支持索引缓存,不支持MVCC高并发,不支持外键,读写会相互阻塞,支持表级锁,崩溃恢复性差。适合于表较小,且只读的数据库。
InnoDB:支持事务,读写阻塞和隔离等级相关,可缓存数据和索引,支持聚簇索引,支持MVCC高并发,MySQL5.5.5之后的默认存储引擎。
Performance_Schema:Performance_Schema数据库专用,该数据库主要用于收集数据库服务器性能参数。且用户不能创建存储引擎为Performance_Schema的表。
Memory:将所有的数据存储在RAM中,以便在需要快速查找参考和其他类似数据的环境中进行快速访问。适用于存放临时数据。
MRG_MYISAM:使MySQL DBA或开发人员能够对一系列相同的MYISAM表进行逻辑分组,并将他们作为一个对象使用,适用于大数据存储,如数据仓库。
Archive:为存储和检索大量很少参考的存档或安全审核信息,只支持查询和插入操作,支持行锁和专用缓存区。
Federated联合:用于访问远程MYSQL服务器的代理,通过创建一个连接远程MYSQL服务的客户端,并将查询传到服务器执行,而后完成数据的存取,提供连接单独MYSQL服务器的能力,以便从多个物理服务器创建一个逻辑数据库,非常适合分布式和数据集市环境。
BDB:可替代InnoDB存储引擎,支持COMMIT,ROLLBACK和其他事务特性。
Cluter/NDB:MYSQL的簇式数据库引擎,尤其适合于具有高性能查找要求的应用程序,这类查找需求还要求具有最高的正常工作时间和可用性。
CSV:CSV存储引擎使用逗号分隔符格式将数据存储在文本文件中,可以使用CSV引擎以CSV格式导入和导出其他软件和应用程序的数据。
BLACKHOLE:黑洞存储引擎接受但不存储数据,检索总是返回一个空值,该功能可用于分布式数据库设计,数据自动复制,但不是本地存储。
example:用于编写开发新的存储引擎。
2、总结MySQL查询缓存优化总结。
1、查看缓存命中率=Query_hits/(Query_hits+Query_insert),若命中率能接受就不用优化了。
2、若觉得命中率太低,判断查询的大部分语句是不是可缓存的,如果发现有些查询语句太大了,超过了系统设置的最大缓存限制导致不可缓存,调大query_cache_limit。
3、如果查询语句都是可缓存的,进一步判断,查询语句是不是发生了很多验证工作,如果是,索命缓存空间不足,判断缓存是不是被碎片化导致的,如果是则减少query_cache_min_unit值,并且flush query cache减少碎片。
4、如果不是缓存空间碎片化导致的,进一步查看是不是缓存空间太小,导致缓存的查询语句太少,如果是,增加缓存空间大小query_cache_size。如果缓存空间大小合适,再就判断查询语句是不是都是新的查询语句,如果是则说明查询不适合用缓存。
5、如果发现并没有很多验证工作,则判断查询缓存是否启用query_cache_type,如果没有则启用;如果启用了,则说明这些查询不适合使用查询缓存
3、MySQL日志各类总结。
1、事务日志:写入类型为追加,也称为“预写式日志”,即将数据库的所有执行的命令都记录在其中。
2、错误日志:数据库服务启动和关闭过程中输出的事件信息,包含产生的错误信息、警告信息等。记录哪些信息由服务器变量log_warnings来决定,日志路径由服务器变量log_error来决定。
3、通用日志:记录数据库的通用操作,包含错误的SQL语句,由服务器变量general_log=ON来启用,general_log_file=HOSTNAME.log来指定日志保存路径。默认是保存在文件中,也可以保存在表中,由服务器变量log_output决定。
4、慢查询日志:记录执行时长超过指定时长的操作。slow_query_log=ON来开启慢查询,long_query_time=N指定慢查询时间阈值,单位是秒。slow_query_log_file来指定慢查询日志文件。log_queries_not_using_indexes=ON不使用索引的语句均记录。
5、二进制日志:记录导致数据改变或者潜在数据改变的SQL语句,不依赖于存储类型。日志有三种格式,一种是基于语句记录,即记录每条导致数据改变的SQL语句,默认模式,日志量少;一种是基于row记录,即记录下每一条导致数据行改变的语句,更加安全,日志量大;第三种是混合模式,系统自动判定使用哪种。二进制日志的开启由两个服务器变量决定,一个是sql_log_bin=ON;一个是log_bin指定日志文件位置,两个都配置了才算开启了二进制文件。
日志类型由服务器变量binlog_format来指定。
服务器变量max_logbin_size来设置单个二进制日志文件的大小,日志写满后自动新开一个。
binlog_cache_size设置每次事务二进制日志缓存的大小。
max_binlog_cache_size限制多事务用于缓存的大小。
sync_binlog二进制日志即使同步磁盘,为1表示缓存立即同步磁盘,为0表示由操作系统来安排磁盘同步。
expire_logs_days=N二进制日志自动删除的天数,默认为0,即永不删除。
用mysqlbinlog可以查看二进制日志文件。
用PURGE BINARY LOGS清除二进制日志。
flush logs新开一个二进制日志。
reset master to #:删除所有二进制日志文件,并重新生成二进制文件,日志编号从#开始计数
6、中继日志:在数据库主从服务架构中,从服务用来保存从主服务器同步过来的二进制日志。