1.数据库三范式
第一范式:数据库中的每个属性都不可以再分
第二范式:满足第一范式的基础上,消除了非主属性对于码的部分函数依赖
第三范式:在第二范式的基础上,消除了非主属性对于码的传递函数依赖。
⚠️:这里所说的码就是候选码(candidiate key),如果k是一个候选码,就代表k确定的时候数据库中的其它属性也就都确定了。从候选码中选择一个作为主码(primary key)。
主属性就是包含在任何一个码中的属性,非主属性就是不包含在任何一个码中的属性。
所以说第二范式就是在第一范式的基础上,所有的非主属性都完全依赖于码。
什么叫传递函数依赖:Y->Z,X->Y,且Y不属于X,且X不函数依赖Y,Z就传递函数依赖于X。
2.什么叫索引?索引有什么用?什么样的属性适合添加索引?
首先我们要知道索引的目的,索引是为了加快数据库中数据的搜索速度,可快速访问数据库表中的特定信息。
索引通常是用b树这种数据结构实现的,下面我们就简单讲一下b树。
b树的核心思想就是为了降低搜索树的高度,从而减少搜索次数也就是I/O操作,提高搜索速度,b树对比起二叉树,每个节点的子节点个数不再是两个而是多个,b树是一棵平衡数,当节点个数增多的时候,b树的搜索速度远远高于二叉搜索树。
b树有什么样的特点呢,一棵M阶的B-Tree满足以下条件:
1)每个结点至多有M个孩子;
2)除根结点和叶结点外,其它每个结点至少有M/2个孩子;
3)根结点至少有两个孩子(除非该树仅包含一个结点);
4)所有叶结点在同一层,叶结点不包含任何关键字信息;
5)有K个关键字的非叶结点恰好包含K+1个孩子;
在这里要解释一下b树中的节点,b树中的节点不仅仅代表一个简单的数字,而是包含了更深刻的含义,b树的节点由三部分组成:关键字 、指针、关键字所代表的文件地址。也就说说我们通过关键字找到文件地址,那么为什么有K个关键字的非叶结点恰好包含K+1个孩子呢,因为有k个关键字的节点里有k+1个指针,每一个指针指向一个孩子。
下面这张图可以很清晰的表达b树的结构
⚠️:b树中每一个节点的关键字是有序的,这样就可以通过二分查找更快的找到要查找的关键字。
查找的时候,可以通过二分查找查找每一个节点的关键字,如果如果要查找的就是关键字那么找到,查找停止。如果关键字没有找到。就定位到一个关键字的范围,然后根据指针,到孩子里继续查找。
⚠️:使用索引虽然提高了数据库的查找效率,却也降低了删除,插入等操作,因为每次更新数据库都要维护这样一个b树,比起简单的更新操作更加耗时,所以不能滥用索引。
索引的类型:聚集索引和非聚集索引。
聚集索引:表数据按照索引的顺序来存储的。对于聚集索引,叶子结点即存储了真实的数据行,不再有另外单独的数据页。
非聚集索引:表数据存储顺序与索引顺序无关。对于非聚集索引,叶结点包含索引字段值及指向数据页数据行的逻辑指针,该层紧邻数据页,其行数量与数据表行数据量一致。
A)叶子结点并非数据结点
B)叶子结点为每一真正的数据行存储一个“键-指针”对
C)叶子结点中还存储了一个指针偏移量,根据页指针及指针偏移量可以定位到具体的数据行。
D)类似的,在除叶结点外的其它索引结点,存储的也是类似的内容,只不过它是指向下一级的索引页的。
3.什么是数据库事务,干什么用的?
事务(transaction)是并发控制的基本单位,是一个操作序列,这些操作要么都执行要么都不执行,是一个不可分割的工作单位。事务是数据库维护数据一致性的单位,在每个事务结束时,都能保持数据一致性。
针对上面的描述可以看出,事务的提出主要是为了解决并发情况下保持数据一致性的问题。
事务的四个特性:
● Atomic(原子性):事务中包含的操作被看做一个逻辑单元,这个逻辑单元中的操作要么全部成功,要么全部失败。
● Consistency(一致性):只有合法的数据可以被写入数据库,否则事务应该将其回滚到最初状态。
● Isolation(隔离性):事务允许多个用户对同一个数据进行并发访问,而不破坏数据的正确性和完整性。同时,并行事务的修改必须与其他并行事务的修改相互独立。
● Durability(持久性):事务结束后,事务处理的结果必须能够得到固化。
事务相关的操作语句:
开始事务:BEGIN TRANSACTION
提交事务:COMMIT TRANSACTION
回滚事务:ROLLBACK TRANSACTION
4.数据库中的锁,乐观锁与悲观锁。
数据库中也存在着多个事务同时存取数据库中的同一数据,从而造成数据不一致的问题。
悲观锁:指的是对数据被外界修改持悲观态度,也就是认为数据会被外界修改,因此在整个数据库操作过程中,将数据锁定。悲观锁的实现,利用了数据库的排他锁(exclusive locking)。
悲观锁的优点与缺点:
悲观并发控制实际上是“先取锁再访问”的保守策略,为数据处理的安全提供了保证。但是在效率方面,处理加锁的机制会让数据库产生额外的开销,还有增加产生死锁的机会;另外,在只读型事务处理中由于不会产生冲突,也没必要使用锁,这样做只能增加系统负载;还有会降低了并行性,一个事务如果锁定了某行数据,其他事务就必须等待该事务处理完才可以处理那行数据。
乐观锁:它假设多用户并发的事务在处理时不会彼此互相影响,各事务能够在不产生锁的情况下处理各自影响的那部分数据。在提交数据更新之前,每个事务会先检查在该事务读取数据后,有没有其他事务又修改了该数据。如果其他事务有更新的话,正在提交的事务会进行回滚。
实现乐观锁的方式主要就是为数据添加版本标识从而记录数据版本。实现数据版本有两种方式:版本号和时间戳。
乐观锁的优点与缺点:
乐观并发控制相信事务之间的数据竞争(data race)的概率是比较小的,因此尽可能直接做下去,直到提交的时候才去锁定,所以不会产生任何锁和死锁。但如果直接简单这么做,还是有可能会遇到不可预期的结果,例如两个事务都读取了数据库的某一行,经过修改以后写回数据库,这时就遇到了问题。
5.drop、delete、truncate有什么区别
首先truncate和drop都是DDL,隐式提交,不能回滚,不会触发trigger/
delete是DML,需要手动提交操作才能生效,可以回滚,触发trigger。
delete和truncate只删除表的数据不删除表的结构,drop可以删除表结构,也就是说把表所占据的空间全部释放掉。
在没有备份的情况下要慎用truncate和drop,因为他们都不能会回滚,一旦操作执行就无法恢复了。
在速度上,一般来说,drop> truncate > delete。
使用场景:
如果想删除部分数据用delete,注意带上where子句,回滚段要足够大;
如果想删除表,当然用drop;
如果想保留表而将所有数据删除,如果和事务无关,用truncate即可;
如果和事务有关,或者想触发trigger,还是用delete;
6.超码、候选码、主码都是什么意思?
超码(super key)能唯一标识元组的属性集,就是说超码中的属性值确定了以后,这个数据中的所有属性就被唯一确定了。
候选码(candidate key)最小的超码就是候选码,也就是没有冗余属性。
主码(primary key)从候选码里选一个就是主码,一个数据列只能有一个主码,主码的值不能为null。
外键(foreign key)一个数据表里存着另一个数据表的主码,就是外键。
7.什么是视图?
视图,也就是view,他是一种虚拟的表,对视图可以进行增删改查等操作,但是不会影响物理表,可以把多表查询的结果构成一个视图,只暴露一部分属性给用户,会使得多表查询更加方便,而且对原始表不造成影响。
参考文章:常见面试题整理--数据库篇