首先,我们用查看数据库支持的存储引擎( show ENGINES;语句)查询目前数据库支持的所有的存储引擎。查询结果如下:
目前,主流的存储引擎为InnDB和MyISAM,其次为ISAM,比较少见的还有Memory、NDBCluster和CSV,其他存储引擎我们基本用不到。
下面来介绍各种存储引擎的特点。
1、ISAM(索引顺序存取法)。是一个定义明确且历经时间考验的数据表格管理方法,它在设计之时就考虑到数据库被查询的次数要远大于更新的次数。因此ISAM执行读取操作速度很快,而且不占用大量的内存和存储资源。不足之处是它不支持事务处理(业务得很简单才能不用事务),也不能容错(比如停电,可能导致数据全部丢失)。因此,使用ISAM必须经常备份所有实时数据。MySQL5.7已不支持ISAM。
2、MyISAM。MyISAM是MySQL的ISAM扩展格式,是MySQl5.5之前版本的默认数据库引擎。除了ISAM里没有的索引和字段管理的大量功能,重点是加了表级锁,依然具备关于出现特别大的问题以及有磁盘碎片的问题。因此,必须经常使用Optimize Table命令清理空间,必须经常备份所有实时数据。该存储引擎不支持事务。数据越多,写操作效率越低。最大优点是快、效率高,缺点是不支持事务、需要定期清理空间和备份。MyISAM存储引擎文件有三个:.frm:表结构信息, .MYD:数据文件, .MYI:表的索引信息。因此索引信息维护起来很方便。
3、InnoDB。InnDB是MySQL5.5之后的默认存储引擎。设计时基于MySQL++Api技术实现。大量考虑了CPU性能问题,因此应用InnDB基本不用考虑硬件方面CPU的问题。InnDB给MySQL提供了具有提交、回滚和崩溃恢复(日志)能力的事务安全(ACID兼容)存储引擎。其缺点是: 慢, 优点: 包括了事务和外键(如果数据库中有表包括外键 无法将存储引擎从InnoDB转换为MyISAM,因为MyISAM不支持外键)。在MySQl5.7版本中,InnDB存储引擎管理的数据文件为两个:.frm和.idb文件,其数据和索引存放在一个文件里。综上,InnDB的特点如下:①、支持事务 ②、数据多版本读取(Inndb、MyISAM、ISAM)③、锁定机制的改进,由表级锁改进到了行级锁 ④、支持外键
4、Memory(内存型数据库)存储引擎 ,是一个将数据存储在内存中的存储引擎。Memory存储引擎不会将任何数据存放到磁盘上,仅有一个表结构相关信息的.frm文件在磁盘上,所以很快。缺点是只要计算机重启数据就全没了。其特点是非常高效,但数据极其不安全。
5、NDBCluster存储引擎。主要用于MySQL Cluster集群环境,Cluster是从MySQL5.0版本才开始提供的新功能。MySQL最大的毛病是扩展性差,自从出现这个存储引擎,逐渐支持集群了。
6、MRG_MYISAM存储引擎,以前叫做MERGE,MySQL5.7中叫做MRG_MyISAM。可以简单理解为实现了对结构相同的MyISAM表通过特殊包装,对外提供一个单一的访问入口,以达到减小应用的复杂度的目的。
7、FEDERATED存储引擎。它所实现的功能和Oracle的DBLink类似。MySQL5.7已经不支持此存储引擎。
8、ARCHIVE存储引擎。主要用来通过较小的存储空间存放过期很少访问的历史数据。类似压缩包。
9、BLACKHOLE存储引擎。数据只能进不能出。没发现有啥用。应该是MySQL内部人员通过特定手段可以读。对开发者来说没有手段取出来。
10、CSV存储引擎。主要用来做报表。专门把数据库中的数据按照CSV扩展格式存储,特点是非常方便导出。
11、PERFORMANCE_SCHEMA存储引擎。专门针对PERFORMANCE_SCHEMA数据库的存储引擎,这个库中的数据表专门用来存放系统参数。
InnDB和MyISAM是最主流的数据库引擎,那两者如何选择呢?我们先来总结一下InnDB和MyISAM的区别:
①、InnDB支持事务 MyISAM不支持。对于Inndb 每一条SQL语言都默认封装成事务,自动提交,这样会影响速度,所以最好把多条SQL语言放在begin transaction 和 commit之间,组成一个事务。
②、InnDB支持外键 而MyISAM不支持,对包含了外键的InnDB表转为MyISAM会失败;
③、InnDB是聚集索引。数据文件和索引绑在一起,在idb文件中。而MyISAM是非聚集索引,文件分别是.myd和.myi
④、InnDB不保存表的具体行数,执行select count(*)from table 时,需要全表扫描。而MyISAM用一个变量保存了整个表的行数,执行
⑤、MySQL5.7版本之前,Inndb不支持全文索引,而MyISAM支持全文索引。因此MySQL5.7版本之前,在查询效率上MyISAM要高。目前的MySQL版本Inndb已支持全文索引。
那如何选择呢?
①、考虑是否要支持事务
②、若表中绝大多数都是查询操作,可以考虑MyISAM,如果读写都频繁,用InnDB
③、考虑系统崩溃后,MyISAM回复起来更困难,是否能接受
④、MySQL5.5版本开始InnDB已经成为MySQL的默认引擎(之前是MyISAM),说明其优势是有目共睹的,如果你不知道用什么,那就用InnDB,至少不会差。
扩展1:
InnDB介绍提到的事务安全(ACID兼容)涉及到的 ACID原则和Base原则
ACID原则是在数据库设计时非常重要的原则,主要应用在分布式存储系统上。其原则实际上就是满足一致性,牺牲可用性(效率)
A:Atomicity:原子性,每次操作是原子的,要么成功,要么不执行。
C:Consistency:一致性,数据库状态一致的。
I:Isolation:隔离性,各种操作之间互不影响
D:Durability:持久性,状态是持久的,不可变的
Base原则与ACID原则正好相反。 原则要求牺牲一致性(但最终达到一致性) 达到可用性
BA:Basically Available 基本可用
S:Soft state 软状态
E:Eventually Consistent 最终一致性
扩展2:
redis的持久化策略有rdb和aof
rdb:所有数据都在dump.rdb文件,Redis每隔一定时间把数据持久化到dump.rdb文件中,所以rdb方式缺点可能出现数据丢失。优点是性能相对好;
aof:监听日志文件进行持久化操作的方式。在对Redis执行新增、删除、修改的命令时,这些命令都会被写入到日志文件中,Redis发现日志文件发生变化,且是新增、删除、修改Redis,立即把变化的数据进行持久化。优点是即使出现特殊情况也能恢复数据,缺点做增删改时效率较低。
扩展3:
分布式和集群的区别
分布式:由多份完整个体组成一个整体,共同完成一件事情,类似微服务;
集群:由一份完整个体,复制多份,部署到不同的服务器上;
以Redis为例,Redis安装完成之后,命令行启动Redis之后最下面有个stand alone说明是单机版;
Redis集群就是多个Redis,只要访问集群的任意一个节点,处理之前内部会进行相对概率上的平分,因此效率高了。