误区
中国式教育总是告诉学生什么是什么,以至于我总是习惯于去记忆一些名词的概念,只知道死记硬背,因此我学到的只是一些名词解释,而不是方法论。很难发现事物的规律和本质。上学的时候,有一门课程叫《数据结构》,里面讲授的是数组、栈、队列、树、图等概念和算法实现,于是我就把数据结构和这些概念和算法在脑海中对应起来,一提到数据结构,我认为就是栈、是队列等等的算法。实则不然,数据结构是一门科学,是一种思维方式,而不是一些死记硬背的算法。
定义
1.什么是结构
结构实际上就是一种关系,谈结构必须要结合某种具体的对象谈。谈某对象的结构,实际上是在谈组成该对象的各个要素是以什么方式构建或组织起来的,也就是研究各个要素之间的关系。
例如,有人问你家的房子的建筑结构是怎样的?你可能会回答钢筋混凝土结构。这就有两层含义,一是组成房子的要素是钢筋和混凝土,而是钢筋混凝土通过一定的组合关系搭建而成的。
2.什么是数据结构
数据结构是针对计算机领域而言的专有名词。因为计算机程序关注的核心概念是数据,因此如何组织这些数据,就叫数据结构。
对计算机底层而言,数据就是二进制位数。结构也就是数据之间的关系,无非是两种基本关系,顺序存放的关系和随机存放的关系。从字面意思上理解数据结构,就是如此。根据我们大学学的数据结构课程可知,我们学的东西远不止此这么简单。那么我们学习的数据结构究竟是个什么鬼呢? 不是栈、队列、树又是什么呢?
实际上栈、队列、树等等只是一种抽象数据类型,我们的课程学习的是这些抽象数据类型,是如何在计算机中实现的。单独讲数据结构并无太大意义,怎么在程序设计过程中,抽象出抽象数据类型,又怎么通过基本数据结构和算法实现这些抽象数据类型,才是学习数据结构这么课程的意义。
用最精简的一句话说就是Cliffor A.Shaffer在《数据结构与算法分析》一书中的定义:“数据结构就是抽象数据类型的物理实现”。
Robert L.Kruse在《数据结构与程序设计》书中, 将数据结构的设计过程分为抽象层,数据结构层和实现层。抽象层就是抽象数据类型层,它讨论数据的逻辑结构及其运算,数据结构层和实现层讨论一个数据结构的表示和在计算机内的存储细节以及运算的实现。
具体来说就是指同一类型数据元素中,各元素之间的相互关系,涉及三个部分,数据的逻辑结构、数据的物理结构以及数据的操作。
研究对象
1.数据的逻辑结构
数据元素之间的逻辑关系,无外乎就是以下四种。
- 互相之间没有关系(集合结构)
- 一对一关系(线性结构)
- 一对多关系(树形结构)
- 多对多关系(图形结构)
2.数据的物理结构
数据的物理结构是数据结构在计算机内的表示,包括数据元素的机内表示和关系的机内表示
数据元素的机内表示:二进制位的位串,通常称为节点
关系的机内表示:
顺序存储:通过相对位置表示逻辑关系,借助程序设计语言的数组来实现。
非顺序存储:
链接存储,通过指针来表示元素间的逻辑关系,借助程序设计语言的指针来实现。
索引存储,除了建立存储节点信息外,还建立附加的索引表来表示节点的地址。
散列存储,通过节点的关键字直接计算出节点的存储地址。
3.数据的操作
由于计算机内存储方式的不同,可知同一个逻辑结构可以有多种存储结构,不同存储结构影响的是数据处理的效率。因此讨论数据结构也要同时讨论在该类数据上执行的运算,针对不同的运算要选择适合的存储结构。
研究意义
计算机程序设计中,构造系统的关键因素在于数据结构而非算法,许多大型系统的构造经验表明,系统实现的困难程度和质量都严重依赖于是否选择了最优的数据结构。很多时候,确定了数据结构,算法也就容易获得。有时候,有了特定的算法也要选择与之适应的数据结构。
研究内容
在计算机科学中,数据结构是一门研究非数值计算的程序设计问题中计算机的操作对象(数据元素)以及它们之间的关系和运算的学科,而且确保经过这些运算后所得到的新结构仍然是原来的结构类型。
数据结构在计算机科学中是一门综合性的专业基础课,是介于数学、计算机硬件和计算机软件三者之间的一门核心课程。
计算机科学是一门研究运用计算机进行信息表示和处理的科学。计算机解决一个具体问题时,大致需要经过下列几个步骤:首先要从具体问题中抽象出一个适当的数学模型,然后设计一个解此数学模型的算法(Algorithm),最后编出程序、进行测试、调整直至得到最终解答。
寻求数学模型的实质是分析问题,从中提取操作的对象,并找出这些操作对象之间含有的关系,然后用数学的语言加以描述。当人们用计算机处理数值计算问题是,所用的数学模型是用数学方程描述。所涉及的运算对象一般是简单的整形、实型和逻辑型数据,因此程序设计者的主要精力集中于程序设计技巧上,而不是数据的存储和组织上。然而,计算机应用的更多领域是“非数值型计算问题”,它们的数学模型无法用数学方程描述,而是用数据结构描述,解决此类问题的关键是设计出合适的数据结构,描述非数值型问题的数学模型是用线性表、树、图等结构来描述的。
计算机算法与数据的结构密切相关,算法无不依附于具体的数据结构,数据结构直接关系到算法的选择和效率。运算是由计算机来完成,这就要设计相应的插入、删除和修改的算法 。也就是说,数据结构还需要给出每种结构类型所定义的各种运算的算法。
计算机算法与数据的结构密切相关,算法无不依附于具体的数据结构,数据结构直接关系到算法的选择和效率。运算是由计算机来完成,这就要设计相应的插入、删除和修改的算法 。也就是说,数据结构还需要给出每种结构类型所定义的各种运算的算法。
结构算法
不同的数据结构其操作集不同,但下列操作必不可缺:
- 生成
- 销毁
- 检索
- 插入
- 删除
- 遍历
抽象数据类型:一个数学模型以及定义在该模型上的一组操作。抽象数据类型实际上就是对该数据结构的定义。因为它定义了一个数据的逻辑结构以及在此结构上的一组算法。抽象数据类型可用以下三元组表示:(D,S,P)。D是数据对象,S是D上的关系集,P是对D的基本操作集。
ADT的定义为:ADT 抽象数据类型名:{数据对象:(数据元素集合),数据关系:(数据关系二元组结合),基本操作:(操作函数的罗列)}
抽象数据类型有两个重要特性:
数据抽象,用ADT描述程序处理的实体时,强调的是其本质特征、所能完成的功能以及它和外部用户的接口。
数据封装,将实体的外部特性和内部实现细节分离,对外部用户隐藏内部实现细节。
研究成果
常用结构:
数组
栈
队列
链表
树
图
堆
散列表
(待续)
参考文献:百度百科