数据结构与算法之美（二）：数组

本章内容源于笔者对极客时间《数据结构与算法之美》以下章节的学习笔记：

数组：为什么很多编程语言中数组都从0开始编号？

开篇思考题：为什么数组要从 0 开始编号，而不是从 1 开始呢？

数组的定义

数组（Array）是一种线性表数据结构。它用一组连续的内存空间，来存储一组具有相同类型的数据。

关键词1：线性表

线性表：就是数据排成一条线一样的结构，每个线性表上的数据最多只有前和后两个方向。数组、链表、队列、栈都是线性表结构。
非线性表：与线性表对立的概念，数据之间并不是简单的前后关系。二叉树、堆、图都是非线性表结构。

关键词2：连续的内存空间和相同类型的数据

利：支持随机访问。
弊：为了保证连续性，删除、插入操作非常低效，因为需要做大量的数据搬移工作。

随机访问

数组的随机访问要用到元素在数组中的下标，那么这是怎么实现的？我们知道计算机会给每个内存单元分配一个地址，通过地址来访问内存中的数据，寻址公式：

// base_address为内存块首地址
// data_type_size为数组中每个元素的大小
a[i]_address = base_address + i * data_type_size

补充：很多人在回答数组和链表的区别时认为数组适合查找，查找的时间复杂度为 O(1)。这种表述不准确，数组是适合查找操作，但是查找的时间复杂度并不是 O(1)，即便是排好序的数组，利用二分查找，时间复杂度也是 O(logn)。准确的说法是，数组支持随访问，根据下标随机访问的时间复杂度是 O(1)。

低效的插入和删除

插入操作

由于数组要保证内存连续性，当要在第k个位置插入一个数据，那么k~n这部分数据都要按顺序往后挪一位。假如插入的位置是数组的末尾，那么数组中原来的元素无需搬移，只需要进行1次操作；假如插入的位置是数组的的首位，那么数组中原来的元素都要往后挪一位，需要操作n次。所以数组中插入元素的时间复杂：

最好情况时间复杂度：O(1)
最坏情况时间复杂度：O(n)
平均情况时间复杂度：(1/n)1 + (1/n)2 + ... + (1/n)*n = O(n)

特定情况：当数组只是被当做一个存储集合，插入第k个位置时，可以先将原本第k个位置的数据搬移到数组元素的最后，再把新的元素直接放入第k个位置。这样时间复杂度就会降为 O(1)。

删除操作

同样为了保证内存的连续性，数组中的删除操作也需要数据搬移，时间复杂度同插入操作。

特定情况：实际操作并不一定非要追求数组的连续性，要删除数组中元素时，可以先将该元素标记为已删除，当数组没有更多空间存储数据时，再触发一次真正的删除操作，这样就能大大减少删除操作导致的数据搬移。

这恰恰就是JVM标记清除垃圾回收算法的核心思想。不管是软件开发还是架构设计，总能找到算法与数据结构的影子。

数据越界

分析以下C语言代码的运行结果：

int main(int argc, char* argv[]){
    int i = 0;
    int arr[3] = {0};
    for(; i<=3; i++){
        arr[i] = 0;
        printf("hello world\n");
    }
    return 0;
}

结果是出现无限循环，一直打印“hello world”。

解析：由于for循环的边界条件是i<=3，而不是i<3，当i增长至3时数组arr[3]访问越界。申明变量时i和arr并列且i在前，arr长度为3，64位操作系统下默认会进行8字节对其，4个整数刚好满足，arr[3]越界后访问到i。arr[3]=0，也就是i=0，于是进入无限循环。

很多计算机病毒正是利用到了代码中的数组越界访问非法地址的漏洞，来攻击系统，编写代码时应当警惕数组越界。
很多语言会做越界检查，抛出异常。

数组与容器

很多语言针对数组类型提供了容器类，这些容器类不仅封装了很多数组操作的细节，还支持动态扩容。例如Java中的ArrayList，每次存储空间不够时，会自动扩容为原来的1.5倍大小。

相对容器，何时使用数组更合适？

例如Java ArrayList无法存储int、long等基本类型，需要封装为Integer、Long类，希望使用基本类型时就可以用数组。
数据大小事先已知且操作简单可以直接用数组。
表示多维数组时，用数组更直观。如Object[][] array。

总结：对于业务开发，直接使用容器就足够了，省时省力。毕竟损耗一丢丢性能，完全不会影响到系统整体的性能。但如果是做一些非常底层的开发，比如开发网络框架，性能的优化需要做到极致，这个时候数组就会优于容器，成为首选。

解答开篇：

为什么大多数编程语言中，数组要从0开始编号，而不是从1开始呢？

答：下标其实就是元素相对数组首地址的偏移量。数组从0开始编号，a[k]表示元素的内存地址就是：

a[k]_address = base_address + k * type_size

如果数组从1开始编号，a[k]表示元素的内存地址就是：

a[k]_address = base_address + (k-1)*type_size

对比发现，如果数组编号从1开始，每次随机访问元素就多了一次减法运算，CPU就多了一次减法指令。另外就是历史原因了。

思考题一：前面提到JVM，说说你所理解的标记清除垃圾回收算法。

参考回答：大多数主流虚拟机采用可达性分析算法来判断对象是否存活，在标记阶段，会遍历所有GC ROOTS，将所有GC ROOTS可达的对象标记为存活。只有当标记工作完成后，清理工作才会开始。不足：1.效率问题。标记和清理效率都不高，但是当知道只有少量垃圾产生时会很高效。2.空间问题。会产生不连续的内存空间碎片。

思考题二：思考一下二维数组的内存寻址公式。

参考回答：对于m*n的二位数组，a[i]j的内存地址为：

address = base_address + ( i * n + j) * type_size

最后编辑于：2018.11.26 21:51:35

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 205,132评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,802评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,566评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,858评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,867评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,695评论 1赞 282
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,064评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,705评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 42,915评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,677评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,796评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,432评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,041评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,992评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,223评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,185评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,535评论 2赞 343