第一章 MySQL体系结构和存储引擎
1.1 mysql中“数据库”和“实例”的概念如何区分
数据库:
数据的结构组织形式,数据在机器上的文件集合
实例:
操作这些文件集合的程序,mysql是一个主进程控制多个线程的程序(单进程多线程的架构)。
1.2 mysql的架构图
有个简书的博客写的挺清晰:MySQL体系架构
外部有个连接层Connectors,向不同的编程语言提供交互接口
内部的MySQL Server从上到下有多个模块:
- 管理服务和工具
各种为mysql各个组件提供的工具,如监控、配置、恢复、备份等 - 连接池
鉴定权限,线程重用,链接限制等,内存、缓冲检查等 - SQL接口(DDL,DML,存储过程,视图,触发器等)
这里DDL和DML的区别?
DDL: Data Define Language,数据定义语言,指一些维护数据表或数据库的属性的操作,如CREATE、ALTER、DROP
DML:Data Manipulation Language,数据控制语言,指对数据的操作指令,如增删查改:SELECT、UPDATE、INSERT、DELETE - Parser
对query的解析 - Optimizer
优化器,实现对query和索引的优化,简化sql等 - 缓存和缓冲区管理
对全局和引擎层的缓存、缓冲管理 - 存储引擎层
mysql的存储引擎是插件化的,任何开发者都可以开发自己的存储引擎。存储引擎是mysql服务器和底层数据文件的桥梁,通过mysql的API和mysql服务器交互,不同的存储引擎实现了逻辑,具有各自不同的特点。 - 文件系统和日志
mysql管理的数据最终还是落盘在系统文件系统上的。
3. 不同存储引擎的差异
当前被证明适合互联网公司应对高并发的引擎:InnoDB
官网对InnoDB特性解读的tutorial链接:官网介绍InnoDB
维基百科中对不同存储引擎的对比:维基百科:mysql存储引擎的对比
再参考InnoDB vs. MyISAM – A Comparison of Pros and Cons可以总结以下特点:
1、MyISAM设计简单,只支持表级锁(因此对于频繁插入和更新的请求来说速度比InnoDB慢),不支持事务,支持地理位置索引,支持全文索引,对于简单的系统来说性能比InnoDB强,尤其适用于很多“读”请求(read-intensive (select))的场景,是一种设计服务于OLAP(OnLine Analytical Processing)场景的存储引擎。
2、InnoDB更复杂,耗费更多的系统资源,数据一致性更好,支持了行级锁(更适合写频繁的场景:write-intensive (inserts, updates)),支持事务,不支持地理位置索引,5.6后才支持全文索引,服务于OLTP(OnLine Transaction Processing)场景的存储引擎,另外InnoDB的MVCC机制(MultiVersion Concurrency Control,多版本并发控制) 使得他具有很好的高并发特性。
3、Memory引擎,把表的数据全放在内存中,数据库重启或崩溃,表中的数据将丢失,只适用于存储临时数据,它默认使用哈希索引。值得注意的是,mysql使用memory引擎存储中间结果集,如果中间结果集大小大于memory引擎表的容量上限或含有memory引擎不支持的TEXT或BLOB类型,则mysql会把数据转存到MyISAM存储引擎表而存到磁盘上,这样的临时表显然会拖慢查询执行速度。
4、连接mysql的方式:进程间通信
进程间通信的几种方式:管道,命名管道,命名字,TCP/IP套接字,UNIX域套接字
这个我得好好复习下,开个专题。。。
书上交代了mysql交互的几种进程间通信方式:
- TCP/IP套接字
网络中使用的最多的通信方式,我们使用的命令行就是该方式来通信的 - 命名管道(named pipe)和共享内存(shared memory)
主要用于同一台服务器上的进程通信 - UNIX域套接字
UNIX域套接字不是一个网络协议,因此也只适用于同一台服务器上的进程通信