线性表概念
- 线性表是零个或多个数据元素的有限序列
- 在复杂的线性表中,一个数据元素可以由若干个数据项组成
学号 | 姓名 | 性别 | 出生年月 |
---|---|---|---|
1 | 张三 | 男 | 1995.3 |
2 | 李四 | 女 | 1994.8 |
3 | 王五 | 女 | 1994.12 |
线性表(List)抽象
- 假设线性表的数据对象集合为 {a1,a2….an} ,每个元素类型为 DataType,除第一个元素 a1 外,每个元素有且只有一个直接前驱元素,除了最后一个元素 an 外,每一个元素都有一个后继元素
- 基本操作
方法 | 描述 |
---|---|
union(L la,L lb) | 将线性表中 lb 存在,但 la 不存在的数据元素插入到 la循环lb中每个元素,判断当前元素是否存在la中,若不存在,插入到la |
InitList(*L) | 初始化操作,建立一个空的线性表 L |
ListEmpty(L) | 若线性表为空则返回true,否则false |
ClearList(*L) | 清空线性表 |
GetElem(L,i,*e) | 返回第 i 个位置元素 |
LocateElem(L,e) | 查找线性表中与e相等的元素,查找成功返回元素,失败返回0 |
ListInsert(*L,i,e) | 在线性表中第i个位置插入新元素e |
ListDelete(L,i,e) | 删除第i个位置的元素,返回e值 |
ListLength(L) | 返回线性表长度 |
线性表:顺序存储
-
用一段地址连续的存储单元依次存储线性表的数据元素,构成顺序存储需要三个属性:
- 存储空间位置
- 数组长度(MaxSize)
- 当前长度(length)
-
地址计算方法:
- 用 0 作为第一个元素下标,第 i 个元素存储在数组 i-1 位置
- 假设每个元素占用 c 个存储单元,那么线性表中第 i+1 个数据元素和第 i 个数据元素存储位置满足下列的关系
- 第 i 个数据元素ai存储位置可以由a1推算得出
- 通过该公式可以随时计算出线性表中任意位置的地址,不管是第一个还是最后一个,都是相同的,它的存取时间性能为O(1),通常把具有这一特点的存储结构称为随机存取结构
插入和删除
- 插入:
- 若插入位置不合理,抛出异常
- 如果线性表长度等于数组长度,抛出异常或动态增加容量
- 从最后一个元素向前遍历到第 i 个位置,分别将它们向后移动一个位置
- 将要插入的元素填入 i 处
- 表长加 1
- 删除:
- 如果删除位置不合理,抛出异常
- 取出删除元素
- 从删除元素开始遍历到最后一个元素,将它们向前移动一个位置
- 表长减 1
优缺点
- 优点:快速的存取表中任意位置的数据
- 缺点:插入和删除操作需要移动大量元素,难以确定存储空间容量,造成存储空间“碎片”
线性表:链式存储
- 不同于顺序存储,存储单元可以是连续的,也可以是不连续的,链式结构中,每个结点(Node)除了要保存数据元素信息外,还要存储它后继元素的存储地址(引用)
- 为了更方便的操作链表,会在单链表的第一个结点前附设一个结点,成为头结点,可以存取线性表长度等附加信息
- 假设p是指向线性表第 i 个元素的指针,则该结点第 aℹ︎ 数据域可以用 p->data 表示,p->next->data = aℹ+1 元素
单链表的读取
- 不同于顺序存储,我们不知道第 i 个元素到底在哪?所以必须从头开始找
获取第i个数据元素的算法思路:- 声明一个结点 p 指向链表第一个结点,初始化 j 从 1 开始
- 当 j<i 时,就遍历链表,让 p 的指针向后移动,不断指向下一个结点, j 累加 1
- 若到链表末尾 p 为空,则说明第 i 个元素不存在
- 否则查找成功,返回结点 p 元素
- 该算法的时间复杂度取决于 i 的位置,当 i=1 时,不需要遍历,第一个就取出了,而当 i=n 时遍历 n-1 次才可以,最坏的情况是 O(n)
单链表的插入
- 若要插入 s 结点,要实现结点 p 、p->next 和 s之间的逻辑变化,让 p 的后继结点为 s 结点,s的后继结点为之前 p->next
- 单链表插入第 i 个数据元素结点的思路:
- 声明一结点 p 指向链表第一个结点,初始化 j 从 1 开始
- 当 j<i 时,遍历链表,让 p 指针向后移动,不断指向下一结点,j 累加 1
- 若到链表末尾 p 为空,则说明第 i 个元素不存在
- 否则查找成功,在系统中生成一个空结点 s
- 将数据元素 e 赋值给 s->data
- 修改逻辑结构 s->next = p->next; p->next = s;
- 返回成功
- 单链表删除第 i 个数据元素结点的思路:
- 声明一结点 p 指向链表第一个结点,初始化 j 从 1 开始
- 当 j<i 时,遍历链表,让 p 指针向后移动,不断指向下一结点,j 累加 1
- 若到链表末尾 p 为空,则说明第 i 个元素不存在
- 否则查找成功,将要删除的结点 p->next 赋给 q
- 单链表的删除标准语句 p->next = q->next
- 将 q 结点中的数据赋给 e 并返回,释放 q 结点
单链表的整表删除
- 声明一个结点 p 和 q
- 将第一个结点赋值给 p
- 循环:将下一个结点赋给 q ,释放 p ,将 q 赋值给 p
单链表与顺序存储结构的优缺点
存储分配方式
- 顺序存储结构用一组连续的存储单元依次存储数据元素
- 单链表采用链式存储结构,用一组任意存储单元存放线性表元素
时间性能
- 查找:顺序存储结构 O(1)、单链表 O(n)
- 插入和删除:
- 顺序存储结构需要平均移动表长一半的元素,时间为 O(n)。单链表在找出某指针位置指针后,插入和删除时间为 O(1),对于插入或删除数据频繁操作,单链表效率优势更明显
- 如我们希望从第 i 个位置插入 10 个元素,对于顺序存储结构意味着,每一次插入都需要移动 n-i 个元素,每次都是 O(n),而单链表,只需在第一次时找到第 i 个位置的指针,此时为 O(n),接下来知识简单的赋值移动指针,时间复杂度为 O(1)
空间性能
- 顺序存储结构需要预先分配存储空间,分大了,浪费,小了易溢出或需要不断动态扩展
- 单链表不需要分配存储空间,元素个数不受限
合并线性表性能
- 要将两个顺序存储结构的线性表合成一个时至少需要复制一个线性表全部结点,甚至是两个线性表的全部结点复制到新的更大的存储空间中,时间复杂度为 O(n)
- 要将两个链式存储结构的线性表合成一个只需要修改线性表 A 的尾结点指向线性表 B 头结点即可,时间复杂度为 O(1)
循环链表
- 单链表只存储了向后的指针,到了尾标志就停止了,这样,某一结点就无法找到它的前驱结点
- 将单链表中的最后结点的指针指向头结点,就形成循环链表
- 单链表原来是判断 p->next 是否为空来判断循环是否结束,而循环链表是判断 p->next 不等于头结点,则循环未结束
循环链表优点
- 有了头结点时,我们可以用 O(1)时间访问第一个结点,但要访问最后一个结点,却需要O(n)时间,因为我们需要将单链表全部扫描一遍
- 而循环链表不用头指针,而是使用尾指针 rear 来表示循环链表,则查找最后结点为 O(1),而开始结点其实就是 rear->next->next ,时间复杂度也为 O(1)
将两个循环链表合成一个
- 要将两个循环链表合成一个,只需要让循环链表 A 的尾指针指向循环链表 B 的头结点,循环链表 B 的尾指针指向循环链表 A 的头结点即可
双向链表
- 在单链表和循环链表中,查找上一个结点的时间复杂度为O(n),因为每次都要从头开始遍历查找
- 双向链表是在单链表的每个结点中,在设置一个指向前驱结点的指针域,所以结点中既有指向上一个结点,也有指向下一个结点
- 双向链表的插入与删除比单链表复杂点,例如插入 s 结点的顺序:
- 把 p 赋值给 s 的前驱
- 把 p->next 赋值给 s 的后继
- 把 s 赋值给 p->next 的前驱
- 把 s 赋值给 p 的后继