datetime:2022-04-09 17:46
author:nzb
数据结构与算法
绪论
基本概念
数据
数据元素、数据项
数据对象、数据结构
数据类型、抽象数据类型(ADT)
数据结构三要素
逻辑结构
集合
线性结构
树形结构
图状结构(网状结构)
物理结构(存储结构)
顺序存储
物理内存中是连续的
非顺序存储
物理内存中是分散的
链式存储
索引存储
散列存储
数据的运算
学习建议
- 概念多,比较无聊。抓大放小,重要的是形成框架,不必纠结细节概念。
链表和数组的区别
数组静态分配内存,链表动态分配内存;
数组在内存中连续,链表不连续是分散的;
数组元素在栈区,链表元素在堆区;
数组利用下标定位,时间复杂度为O(1),链表定位元素时间复杂度O(n);
链表也没有下标的概念,只能通过头节点指针,从每一个节点,依次往下找,因为下个节点的位置信息只能通过上个节点知晓。
数组插入或删除元素的时间复杂度O(n),链表的时间复杂度O(1)。
链表只需要知道操作位置的指针
树与二叉树
定义
树(Tree)是 n(n>=0)个结点的有限集。n=0 时称为空树。在任意一颗非空树中:
1)有且仅有一个特定的称为根(Root)的结点;
2)当 n>1 时,其余结点可分为 m(m>0) 个互不相交的有限集T1、T2、......、Tn,其中每一个集合本身又是一棵树,并且称为根的子树。
此外,树的定义还需要强调以下两点:
1)n>0 时根结点是唯一的,不可能存在多个根结点,数据结构中的树只能有一个根结点。
2)m>0 时,子树的个数没有限制,但它们一定是互不相交的。
示例树:
结点的度
一个结点拥有的子树数目称为结点的度。叶子节点的度为 0 。
叶子节点:没有子节点的节点
所有节点中的最大的度称为树的 度,树中的节点树即为树中所有节点的度之和加一:即:树中的节点树 = 树中所有节点的度之和 + 1
结点关系
结点子树的根结点为该结点的孩子结点。相应该结点称为孩子结点的双亲结点。
上图中,A 为 B 的双亲结点,B 为 A 的孩子结点。
同一个双亲结点的孩子结点之间互称兄弟结点。
上图中,结点 B 与结点 C 互为兄弟结点。
结点层次和树的深度
从根开始定义起,根为第一层,根的孩子为第二层,以此类推。
树中结点的最大层次数称为树的深度或高度。上图所示树的深度为4。
二叉树
定义
二叉树是 n(n>=0) 个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树组成。
二叉树特点
1)每个结点最多有两颗子树,所以二叉树中不存在度大于2的结点。
2)左子树和右子树是有顺序的,次序不能任意颠倒。
3)即使树中某结点只有一棵子树,也要区分它是左子树还是右子树。
4)非空二叉树只有一个根节点。
二叉树性质
1)在二叉树的第 i 层上最多有 2^(i-1) 个节点 。(i>=1)
2)二叉树中如果深度为 k ,那么最多有 2^k-1个节点。(k>=1)
3)n0 = n2 + 1: 度为0的节点(叶子节点)总是比度为 2 的节点多一个。
n0 表示度数为 0 的节点数,n2 表示度数为2的节点数。
4)在完全二叉树中,具有n个节点的完全二叉树的深度为[log2n]+1,其中[log2n]是向下取整。
具有 n 个节点的二叉树的深度至少为 [log2n]+1,其中 [log2n] 是向下取整。
5)若对含 n 个结点的完全二叉树从上到下且从左至右进行 1 至 n 的编号,则对完全二叉树中任意一个编号为 i 的结点有如下特性:
(1) 若 i=1,则该结点是二叉树的根,无双亲, 否则,编号为 [i/2] 的结点为其双亲结点;
(2) 若 2i>n,则该结点无左子树, 否则,编号为 2i 的结点为其左子树结点;
(3) 若 2i+1>n,则该结点无右子树, 否则,编号为 2i+1 的结点为其右子树结点。
斜树
斜树:所有的结点都只有左子树的二叉树叫左斜树。所有结点都是只有右子树的二叉树叫右斜树。这两者统称为斜树。
满二叉树
满二叉树:在一棵二叉树中。如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上,这样的二叉树称为满二叉树。
满二叉树的特点有:
1)第 k 层上有 2 ^ (k - 1) 个节点。
2)深度为 m 的满二叉树有 2 ^m - 1个节点
3)非叶子结点的度一定是2。
完全二叉树
完全二叉树:对一颗具有 n 个结点的二叉树按层编号,如果编号为 i(1<=i<=n) 的结点与同样深度的满二叉树中编号为i的结点在二叉树中位置完全相同,则这棵二叉树称为完全二叉树。
除最后一层外,每一层的节点数都达到了最大值,在最后一层上只缺少右边的若干个节点。
满二叉树一定是完全二叉树,但反过来不一定成立。
二叉树的存储结构
顺序存储
二叉树的顺序存储结构就是使用一维数组存储二叉树中的结点,并且结点的存储位置,就是数组的下标索引。
二叉树为完全二叉树
一棵完全二叉树采用顺序存储方式,当二叉树为完全二叉树时,结点数刚好填满数组。
二叉树不为完全二叉树
其中浅色结点表示结点不存在,其中,∧表示数组中此位置没有存储结点。此时可以发现,顺序存储结构中已经出现了空间浪费的情况。
右斜树
对于这种右斜树极端情况,采用顺序存储的方式是十分浪费空间的。
因此,顺序存储一般适用于完全二叉树。
二叉链表
链式存储:由二叉树定义可知,二叉树的每个结点最多有两个子节点。因此,可以将结点数据结构定义为一个数据和两个指针域。
采用一种链表结构存储二叉树,这种链表称为二叉链表。
二叉树遍历
二叉树的遍历一个重点考查的知识点。
定义
二叉树的遍历:是指从二叉树的根结点出发,按照某种次序依次访问二叉树中的所有结点,使得每个结点被访问一次,且仅被访问一次。
二叉树的访问次序可以分为四种
前序遍历
中序遍历
后序遍历
层序遍历
前序遍历
根 - 左 - 右
前序遍历通俗的说就是从二叉树的根结点出发,当第一次到达结点时就输出结点数据,按照先向左在向右的方向访问。
上图所示二叉树的前序遍历输出为:ABDHIEJCFG
中序遍历
左 - 根 - 右
中序遍历就是从二叉树的根结点出发,当第二次到达结点时就输出结点数据,按照先向左在向右的方向访问。
上图所示二叉树的前序遍历输出为:HDIBJEAFCG
后序遍历
左 - 右 - 根
后序遍历就是从二叉树的根结点出发,当第三次到达结点时就输出结点数据,按照先向左在向右的方向访问。
上图所示二叉树的前序遍历输出为:HIDJEBFGCA
层次遍历
- 层次遍历就是按照树的层次自上而下的遍历二叉树。针对上图所示二叉树的层次遍历结果为:ABCDEFGHIJ
遍历常考考点
1)已知前序遍历序列和中序遍历序列,确定一棵二叉树。
例题:若一棵二叉树的前序遍历为ABCDEF,中序遍历为CBAEDF,请画出这棵二叉树。
分析:前序遍历第一个输出结点为根结点,故A为根结点。早中序遍历中根结点处于左右子树结点中间,故结点A的左子树中结点有CB,右子树中结点有EDF。
按照同样的分析方法,对A的左右子树进行划分,最后得出二叉树的形态如下图所示
2)已知后序遍历序列和中序遍历序列,确定一棵二叉树。
- 后序遍历中最后访问的为根结点,因此可以按照上述同样的方法,找到根结点后分成两棵子树,进而继续找到子树的根结点,一步步确定二叉树的形态。
注:已知前序遍历序列和后序遍历序列,不可以唯一确定一棵二叉树。