数据结构与算法（一），概述

转载请注明出处：http://www.jianshu.com/p/9f23c9604a2e

数据结构学了有一年的时间了，但是一直没有好好的总结一下，现在回想起来，感觉好像都不怎么记得了。所以接下来一段时间我将重新学习一下，算是温故而知新了。本着「分享是一种美德」的精神，我将把我的学习总结记录下来，并与大家分享。

本节的主要内容有：

一、数据结构
- 1、定义
- 2、关于数据结构的几个术语
- 3、逻辑结构与物理结构
二、抽象数据类型
三、算法
四、算法的复杂度
- 1、时间复杂度
- 2、空间复杂度

一、数据结构

1、定义

数据结构是计算机存储、组织数据的方式。在现实世界中，不同数据元素之间不是独立的，而是存在特定关系的，我们将这些关系称为结构。同样在计算机中，数据元素也不是孤立、杂乱无序的，而是具有内在联系的数据集合。

数据元素之间存在的一种或多种特定关系，也就是数据的组织形式，叫数据结构。也可以说，数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。

通常情况下，精心选择的数据结构可以带来更高的运行或者存储效率。程序设计的实质就是数据结构和算法是设计，因此我们说程序设计 = 数据结构 + 算法。

2、关于数据结构的几个术语

数据：是描述客观事物的符号，是计算机中可以操作的对象，是能被计算机识别，并输入给计算机处理的符号集合。它不仅包括整型等数值类型，还包括字符、声音、图像等非数值类型。这些类型都具备两个特征：
- 可以输入计算机
- 能被计算机程序处理
数据元素：是组成数据的、有一定意义的基本单位，在计算机中通常作为整体处理。也被称为记录。
数据项：一个数据元素可以由若干个数据项组成。数据项是A数据的不可分割的最小单位。。
数据对象：是性质相同的数据元素的集合，是数据的子集。

例如：一本书的书目信息为一个数据元素，而书目信息的每一项（如书名、作者名等）为一个数据项。

3、逻辑结构与物理结构

按照不同的角度，数据结构可分为逻辑结构和物理结构。其中逻辑结构是面向问题的，而物理结构是面向计算机的，它们的基本目标都是将数据及其逻辑关系存储到计算机内存中。

逻辑结构：是指数据对象中数据元素之间的相互关系。分为四种：集合结构、线性结构、树形结构和图形结构。

四种逻辑结构

物理（存储）结构：是指数据的逻辑结构在计算机中的存储形式。数据的存储结构应正确反映数据元素之间的逻辑关系，这是关键。数据元素的存储结构可分为两种：顺序存储结构和链式存储结构。
- 顺序存储结构：把数据元素放在地址连续的存储单元中，数据间的逻辑关系和物理关系一致。如，数组。
- 链式存储结构：把数据元素放在任意的存储单元中，数据间使用指针关联。数据元素的存储关系不能反映其逻辑关系。如，链表。

二、抽象数据类型

数据类型是指一组性质相同的值的集合及定义在该集合上的一些操作的总称。而抽象是指抽象出事物具有的普遍性的本质，它是抽出问题的特征而忽略非本质的细节，是对具体事物的一个概括。抽象隐藏了繁杂的细节，只保留实现目标所必须的信息。因此抽象数据类型可以定义为：

抽象数据类型（Abstract Data Type，ADT）是指一个数学模型及定义在该模型上的一组操作，它是一种向用例隐藏内部表示的数据类型。

面向对象编程的特征之一就是使用数据类型的实现封装数据，以简化实现、隔离用例开发、实现模块化编程。抽象数据类型体现了程序设计中问题分解、抽象和信息隐藏的特性。它将实际生活中的问题分解为多个规模小、能够独立开发和调试的小型模块，然后进行独立编程。这种方式将代码的影响限制在局部区域，改进了我们的软件质量，促进了代码复用。抽象数据类型抽象的层次越高，那么可复用性也越强。比如：java中的Object是对所有对象的抽象。

java中数据类型可以分为两类：

java数据类型

基本（原子）类型：不可以再分解的基本类型，包括int、short、long等
引用（结构）类型：由其他类型组合而成，可以再分解。如，String、数组等

注意：

对原子类型的操作不一定是原子操作，这点并发编程时应特别注意。如，在32位机上对long类型的操作就不是原子操作，因为其高32位和低32位是分别存储的。
Java中所有的基本数据类型都有固定的存储范围和大小，其不受具体机器和操作系统的影响。

三、算法

算法（Algorithm)一词最早出现在波斯数学家al-Khwarizmi所写的《印度数字算术》中。欧几里得算法（求两个整数的最大公约数）被认为是史上第一个算法。

算法是解决特定问题求解步骤的描述，在计算机中表现为指令的有限序列，并且每条指令表示一个或多个操作。

算法的基本特性：

输入输出，算法具有零个或多个输入，至少有一个或多个输出。
有穷性，算法在执行有限步后能够自动结束，不会出现无限循环。
确定性，算法的每一步都具有确定的含义，不会出现二义性。
可行性，算法的每一步都能够通过执行有限次操作完成。

程序与算法的区别：

程序（program）是软件开发人员根据用户需求开发的、用程序设计语言描述的适合计算机执行的指令（语句）序列。它包括「数据结构」、「算法」、「程序设计方法」和「编程语言」。程序是算法用某种程序设计语言的具体实现。程序可以不满足算法的有穷性，比如操作系统也是一种程序，它可以一直运行。

算法的设计要求：

正确性，算法至少应该具有输入、输出和加工处理无歧义、能正确反映问题的需求、能够得到问题的正确答案。
可读性，便于阅读、理解和交流。
健壮性，输入不合法时，算法能够给出相应的处理，而不是产生错误的结果。
高效性，算法应该尽量满足高效率和低存储的需求。

四、算法的复杂度

算法复杂度分为时间复杂度和空间复杂度。其作用：时间复杂度是指执行算法所需要的计算工作量；而空间复杂度是指执行这个算法所需要的内存空间。

1、时间复杂度

算法的时间复杂度反映了算法执行的时间长短，它是度量一个算法好坏的重要指标。

一般情况下，算法中基本操作重复执行的次数是问题规模n的某个函数，用T(n)表示，若有某个辅助函数f(n),使得当n趋近于无穷大时，T(n)/f(n)的极限值为不等于零的常数，则称f(n)是T(n)的同数量级函数。记作T(n)=O(f(n)),称O(f(n)) 为算法的渐进时间复杂度，简称时间复杂度。

度量一个算法的时间复杂度通常有两种方式：

事后统计法
事前分析法(大O表示法)

算法的时间复杂度是由最深层嵌套语句的频度决定的。

大O表示法的推导：

用常数1取代运行时间中的所有加法常数
在修改后的运行次数函数中，只保留最高阶
将最高阶系数变为1

例1:

int i, j, temp;
for(i=0; i<n; i++) {
    for(j=i, j<n; j++) {
        temp++;
    }
}

语句执行的总次数：

所以其时间复杂度为O(n^2)。

例2:

for(i=1;i<=n;i=i*2){
   System.out.println(i);
}

执行的总次数满足：

所以它的时间复杂度为O(logn)

例3：分析冒泡排序算法的时间复杂度

//冒泡排序算法
public static void bubbleSort(int[] data) {

    if (data == null) {
        return;
    }
    int temp = 0;
    for (int i = data.length - 1; i > 0; --i){
        for (int j = 0; j < i; ++j){
            if (data[j + 1] < data[j]){
                temp = data[j];
                data[j] = data[j + 1];
                data[j + 1] = temp;
            }
        }
    }
}

算法分析：

最佳情况下（初始状态是正序时），冒泡排序算法只需要一次扫描即可完成排序，此时比较次数 C_min = n - 1，移动次数 M_min = 0，所以时间复杂度为 O(n)
最差情况下（初始状态为逆序时），需要进行 n-1 次排序，每次排序进行 n-1 比较，此时比较次数 C_max = n(n+1)/2，移动次数 M_max = 3n(n+1)/2，所以时间复杂度为 O(n^2)

常见时间复杂度大小关系：

算法的时间复杂度和两个因素有关：算法中的最大嵌套循环层数；最大嵌套循环结构中每次循环的次数。一般来说，具有多项式时间复杂度的算法是可以接受的；具有指数时间复杂度的算法，只有当n足够小时才可以使用。一般效率较好的算法要控制在 O(N)或者O(log2 N)

2、空间复杂度

空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的量度，记做S(n)=O(f(n))。其中，n为问题规模，f(n)为语句关于n所占存储空间的函数。

算法的空间复杂度分析方法和算法的时间复杂度分析方法基本相同。

例如:

int i, j, temp;
for(i=0; i<n; i++) {
    for(j=i, j<n; j++) {
        temp++;
    }
}

上方代码中，仅需为变量 i、j、temp分配空间即可，所以空间复杂度 S(n) = O(1)。

参考

《大话数据结构》
《算法》第四版
数据结构Java实现01----算法概述

最后编辑于：2017.12.04 04:42:13

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,126评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,254评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,445评论 0赞 341
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,185评论 1赞 278
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,178评论 5赞 371
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,970评论 1赞 284
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,276评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,927评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,400评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,883评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,997评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,646评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,213评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,204评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,423评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,423评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,722评论 2赞 345