第 5 章 树与二叉树
5.1. 树的基本概念
5.1.1. 定义
个节点的有限集,当 时,称为空树
- 有且仅有一个特定的称为 根 的节点
- 当 时,其余节点可分为 个互不相较的有限集,每个有限集又是一棵树,称为根的子树
5.1.2. 基本术语
- 父节点、兄弟节点、子节点
- 一个节点孩子的个数称为该节点的度,树中节点的最大度数称为树的度
- 度大于 0 的节点为分支节点,度为 0 的节点为叶子节点
- 树的深度 = max{左子树的深度, 右子树的深度} + 1
- 有序树和无序树:树中各子树从左到右是有次序的,不能交换,称为有序树
- 路径长度:树中两个节点之间的路径的边的个数
- 森林: 棵互不相交的树的集合
5.1.3. 树的性质
- 树中节点数等于所有节点的度数之和加一
- 度为 的树中第 层上至多有 个节点
- 高度为 的 叉树至多有 个节点
- 具有 个节点的 叉树的最小高度为
5.2. 二叉树
5.2.1. 定义和特性
1. 定义
最多只有两棵子树,次序不能颠倒。
2. 特殊的二叉树
- 满二叉树
- 高度为 ,则节点数为
- 完全二叉树
- 每个节点都能和高度相等的满二叉树中的节点对应(只允许缺最下层的靠右的叶子节点)
- 若 ,则 为分支节点,否则为叶子节点
- 若有度为 1 的节点,则只可能有一个,且它只有左孩子,没有右孩子
- 按层次排序,若编号为 为叶子或只有左孩子,那么编号大于 的都是叶子节点
- 若 为奇数,则每个分支节点都有左右孩子
- 若 为偶数,则编号最大的分支节点只有左孩子
- 二叉排序树
- 左子树上所有节点的关键字均小于根节点的关键字
- 右子树上所有节点的关键字均大于根节点的关键字
- 平衡二叉树
- 树上任意一节点的左右子树深度之差不超过 1
3. 性质
- 非空二叉树上的叶子节点数等于度为 2 的节点数加 1,即
- 非空二叉树上第 层上至多有 个节点
- 高度为 的二叉树至多有 个节点
- 对完全二叉树按从上到下,从左到右的顺序依次编号为 则有
- 当 时,节点 的父节点编号为
- 当 时,节点 的左孩子编号为
- 当 时,节点 的右孩子编号为
- 节点 所在层次为
- 具有 个节点的完全二叉树高度为
5.2.2. 存储方式
- 数组方式——堆
- 链表方式——树状链表
5.3. 二叉树的遍历和线索二叉树
5.3.1. 遍历
1. 先序遍历
2. 中序遍历
3. 后续遍历
4. 层次遍历
5.3.2. 线索二叉树
1. 基本概念
遍历二叉树是以一定的规则将二叉树中的结点排列成一个线性序列,从而得到几种遍历序列,使得该序列中的每个结点(第一个和最后一个结点除外)都有一个直接前驱和直接后继。
传统二叉树只能体现一种父子关系,不能直接的到节点在遍历中的前驱或后继。在 个节点的二叉树中,有 个空指针,可以将他们利用起来。
规定:若无左子树,令 lchild
指向其前驱结点;若无右子树,令 rchild
指向其后继结点。如表所示,还需增加两个标志域标识指针域是指向左(右)孩子还是指向前驱(后继)。
lchild | ltag | data | rtag | rchild |
---|
ltag
- 0 ——
lchild
指向左孩子 - 1 ——
lchild
指向前驱
- 0 ——
rtag
- 0 ——
rchild
指向右孩子 - 1 ——
rchild
指向后继
- 0 ——
2. 中序线索二叉树的构造
二叉树的线索化是将二叉链表中的空指针改为指向前驱或后继的线索。而前驱或后继的信息只有在遍历时才能得到,因此线索化实质就是遍历一次二叉树。
3. 中序线索二叉树的遍历
4. 先序线索二叉树与后续线索二叉树
5.4. 树、森林
5.4.1. 树的存储结构
graph TD
R((R)) --- A((A))
R --- B((B))
R --- C((C))
A --- D((D))
A --- E((E))
C --- F((F))
F --- G((G))
F --- H((H))
F --- K((K))
%%{init: {'theme':'dark'}}%%
graph TD
R((R)) --- A((A))
R --- B((B))
R --- C((C))
A --- D((D))
A --- E((E))
C --- F((F))
F --- G((G))
F --- H((H))
F --- K((K))
1. 双亲表示法
data | parent | |
---|---|---|
0 | R | -1 |
1 | A | 0 |
2 | B | 0 |
3 | C | 0 |
4 | D | 1 |
5 | E | 1 |
6 | F | 3 |
7 | G | 6 |
8 | H | 6 |
9 | K | 6 |
2. 孩子表示法
3. 孩子兄弟表示法
使用这种方法,可以将多叉树转化为等价的二叉树
5.5. 树与二叉树的应用
5.5.1. 哈夫曼树和哈夫曼编码
1. 定义
带权路径长度
带权路径长度最小的二叉树称为哈夫曼树,也称最优二叉树。
2. 构造
给定 个权值分别为 的节点,构造方法如下
- 将这 个节点分别作为 棵仅含一个节点的二叉树,构成森林
- 构造一个新节点,从 中选出两棵根节点权值最小的树作为新节点的左右子树,并且将新节点的权值置为左右子树上根节点的权值之和。
- 从 中删除刚才选出的两棵树,同时将新得到的树加入 中
- 重复 (2)(3) 两步,直至 中只有一棵树为止
特点
- 权值越小的节点到根节点的路径长度越大
- 节点总数为
- 每次选择 2 棵树作为新节点的孩子,因此哈夫曼树中不存在度为 1 的节点
3. 哈夫曼编码
左路径为 0,右路径为 1,可以将每个数据进行编码。当然,编码不唯一。对编码后的数据进行解码时,各个编码的长度不同,但是这些编码没有公共前缀,可以沿着哈夫曼树的编码路径走到叶子节点。
5.5.2. 并查集
支持以下 3 种操作
Initial(S)
将集合S
中每个元素都初始化为只有一个单元素的子集合Union(S, Root1, Root2)
把集合S
中的子集合Root2
并入Root1
。要求Root1
和Root2
不相交Find(S, x)
查找集合S
中单元素x
所在的子集合,并返回该子集合的根节点