平衡二叉树(AVL树)
由于二叉查找树有时候查找的复杂度达到O(n),起不到使用二叉查找树来进行数据查询优化的目的。于是需要对树的结构进行调整,使树的高度在每次插入元素仍能保持O(logn)的级别,于是产生了平衡二叉树
AVL树仍然是一棵二叉查找树,只是在其基础上增加了“平衡”的要求。所谓平衡是指,对AVL树的任意结点来说,其左子树与右子树的高度之差的绝对值不超过1,其中左子树与右子树的高度之差称为该结点的平衡因子
只要能随时保证每个结点平衡因子的绝对值不超过1,AVL的高度就始终能保持O(logn)级别。由于需要对每个结点都得到平衡因子,因此需要在树的结构中加入一个变量height,用来记录以当前结点为根结点的子树的高度:
struct node {
int v, height; //v为结点权值,height为当前子树高度
node *left, *right; //左右孩子结点地址
};
新建结点
//生成一个新结点,v为结点权值
node* newNode(int v) {
node* Node = new node; //申请一个node型变量的地址空间
Node->v = v; //结点权值为v
Node->height = 1; //结点高度初始为1
Node->lchild = Node->rchild = NULL; //初始状态下没有左右孩子
return Node; //返回新建结点的地址
}
获取树的高度height
//获取以root为根结点的子树的当前height
int getHeight(node* root) {
if(root == NULL) return 0;
return root->height;
}
计算平衡因子
//计算结点root的平衡因子
int getBalanceFactor(node* root) {
//左子树高度减右子树高度
return getHeight(root->lchild) - getHeight(root->rchild);
}
因为没有办法通过当前结点的子树的平衡因子计算得到该结点的平衡因子,而需要借助子树的高度间接求得。显然,结点root所在子树的height等于其左子树的height与右子树的height的较大值加1。
void updateHeight(node* root) {
//max(左孩子的height,右孩子的height) + 1
root->height = max(getHeight(root->lchild), getHeight(root->rchild)) + 1;
}
平衡二叉树的基本操作
主要是AVL树的查找、插入和建立
- 查找操作
由于AVL树本身是一棵BST树,因此其查找操作的做法与BST树相同。
//search函数查找AVL树中数据域为x的结点
void search(node* root, int x) {
if(root == NULL) {
printf("search failed\n");
return ;
}
if(x == root->data) {
printf("%d\n", root->data);
} else if(x > root->data) {
search(root->lchild, x); //往左子树搜索x
} else {
search(root->rchild, x); //往右子树搜索
}
}
- 插入操作
左旋
//左旋(Left Rotation)
void L(node* &root) {
node* temp = root->rchild; //root指向结点A,temp指向结点B
root->rchild = temp->lchild; //让B的左子树成为A的右子树
temp->lchild = root; //让A成为B的左子树
updataHeight(root); //更新结点A的高度
updataHeight(temp); //更新结点B的高度
root = temp; //将根结点设为结点B
}
右旋
//右旋(Right Rotation)
void R(node* &root) {
node* temp = root->lchild; //root指向结点B,temp指向结点A
root->lchild = temp->rchild; //让A的右子树成为B的左子树
temp->rchild = root; //让B成为A的右子树
updataHeight(root); //更新结点A的高度
updataHeight(temp); //更新结点B的高度
root = temp; //将根结点设为结点A
}
左旋和右旋的对称本质——它们互为逆操作
只要把最靠近插入结点的失衡结点调整到正常,路径上的所有结点就都会平衡
假设最靠近插入结点的失衡结点是A,显然它的平衡因子只可能是2或者-2。很容易发现这两种情况完全对称,因此主要讨论结点A的平衡因子是2的情形。
A的平衡因子是2的情形
由于结点A的平衡因子是2,因此左子树的高度比右子树大2,于是以结点A为根结点的子树一定是两种形态LL型与LR型之一(注意:LL和LR只表示树型,不是左右旋的意思)。结点A、B、C的权值满足A > B > C。可以发现,当结点A的左孩子的平衡因子是1时为LL型,是-1型时为LR型。
先考虑LL型,可以把C为根结点的子树看作一个整体,然后以结点A作为root进行右旋,便可以达到平衡。
然后考虑LR型,可以先忽略结点A,以结点C为root进行左旋,就可以把转化为LL型,然后按上面LL型的做法进行一次右旋即可。
A的平衡因子是-2的情形
由于结点A的平衡因子为-2,因此右子树的高度比左子树大2,于是以结点A为根结点的子树一定是两种形态RR型与RL型之一,由于和上面讨论的LL型和LR型对称,此处结点A、B、C的权值满足A < B < C。可以发现,**当结点A的右孩子的平衡因子是-1时为RR型,是1时的RL型。
对RR型来说,可以把以C为根结点的子树看作一个整体,然后以结点A作为root进行左旋,便可以达到平衡。
对RL型来说,可以先忽略结点A,以结点C为root进行右旋,就可以把情况转化为RR型,然后按上面RR型的做法进行一次左旋即可。
汇总:
树型 判定条件 调整方法
LL BF(root) = 2, BF(root->lchild) = 1 对root进行右旋
LR BF(root) = 2, BF(root->lchild) = -1 先对root->lchild进行左旋,再对root进行右旋
RR BF(root) = -2, BF(root->rchild) = -1 对root进行右旋
RL BF(root) = -2, BF(root->rchild) = 1 先对root->rchild进行右旋,再对root进行左旋
首先,AVL树的插入代码是在二叉查找树的插入代码的基础上增加平衡操作的,因此,不考虑平衡操作,代码是下面这样的。
//插入权值为v的结点
void insert(node* &root, int v) {
if(root == NULL) { //到达空结点
root = newNode(v);
return ;
}
if(v < root->v) {
insert(root->lchild, v);
} else {
insert(root->rchild, v);
}
}
在这个基础上,由于需要从插入的结点开始从下往上判断结点是否平衡,因此需要在每个insert函数之后更新当前子树的高度,并在这之后根据树型是LL型、LR型、RR型、RL型之一来进行平衡操作
//插入权值为v的结点
void insert(node* &root, int v) {
if(root == NULL) { //到达空结点
root = newNode(v);
return ;
}
if(v < root->v) {
insert(root->lchild, v);
updataHeight(root); //更新树高
if(getBalanceFactor(root) == 2) {
if(getBalanceFactor(root->lchild) == 1) { //LL型
R(root);
} else if(getBalanceFactor(root->lchild) == -1) { //LR型
L(root->lchild); //算法笔记上是这样,不过笔者疑惑应该是左旋右孩子才对
R(root);
}
}
} else {
insert(root->rchild, v);
updataHeight(root); //更新树高
if(getBalanceFactor(root) == -2) {
if(getBalanceFactor(root->rchild) == -1) { //RR型
L(root);
} else if(getBalanceFactor(root->rchild) == 1) {
R(root->rchild); //算法笔记上是这样,不过笔者疑惑应该是右旋左孩子才对
L(root);
}
}
}
}
- AVL树的建立
//AVL树的建立
node* Create(int data[], int n) {
node* root = NULL; //新建空结点root
for(int i = 0; i < n; i++) {
insert(root, data[i]); //将data[0]~data[n - 1]插入AVL树中
}
return root; //返回根结点
}