Java ArrayList源码分析(一）

标签（空格分隔）： java

上一篇文章我们简单的对java集合框架有了一个简单的认识，本次，我们来具体的探讨一下集合框架中的一些接口的继承和实现。我不计划使用简单的陈述性的语言来描述，而是大家一起探讨性的学习。

首先，我们从最常用最清楚的ArrayList类入手，我并不打算一开始就从上至下的分析其源码是如何实现的，为什么呢？这个类这么多方法，这么多的功能，为什么会有这个方法？，这样分析我们很迷茫啊，
首先我们来一个宏观的认识类的继承结构：

ArrayList类继承结构.png

当我们看到这个图的时候，我们的第一个感觉就是这么多继承关系，是吗？

哈哈，扯淡的，java中哪有多继承，准确的说应该是继承和实现关系，只有和AbstractList类是继承关系，其他的都是实现，也就是说其他的都是接口勒。既然是接口也就是说功能上具有独立性，也就是说他们只是对ArrayList进行各种方面的扩展，我们这里只讨论主要的功能，就是集合的功能，哪些东西是集合的功能呢？

这个我们一眼就看的出来，Collection,其他的是什么鬼，我也不知道，目前为止，我就知道Collection具有集合的功能，Iterable是操作集合的迭代器，但是，从实现和继承的关系，我们可以知道，AbstractCollection和List都和Collection有关系，而且，从图上可以看出来，他们一个是实现，一个是继承，这里我声明一下，这个图不是我画的，是idea工具自动生成的。。。也就是说List是一个接口，AbstractCollection是一个实现类，好了先看看我们的认识是不是正确的？

打开AbstractCollection和List源码，看看

AbstractCollection.png

List.png

哈哈，还真是的，但是我们还有一个意外的发现，AbstractCollection是一个抽象实现类，卧槽，怪不得它的类名是这样的。既然是抽象的就说明实现了部分东西，要不然这货为啥实现呢？好我们看看她实现了什么？

AbstractCollection实现类结构图.png

这个如何看，看见第二个和第三个与其他的区别了吗？一个明显的区别，这两个前面的m小圆圈是开口的，哈哈。又扯淡，不错，这两个方法就是没有实现的，其他的都是实现了的，我们来看几个吧

//没有实现，反正就是返回一个迭代器就行了，
  public abstract Iterator<E> iterator();
//没实现，功能吗都知道就是计算这个集合的大小的，至于如何计算。。。我也不知道。
public abstract int size();

行了，我们来看一个实现的东西：我们看到isEmpty（）实现了，这个看看

 public boolean isEmpty() {
        return size() == 0;
    }

额。。。好吧，这个实现我服，哈哈哈，以后我也可以这样来个Collection的实现类了。so easy在看一个
就看boolean contains(Object o)这个方法吧。

我们自己先分析一下，如果是我们自己的话如何实现呢?
我的话，会这样，首先我们要便利这个集合，从第一个开始，从集合中取出元素，然后和这个对象进行对比，对比是什么呢?上一篇就剧透过，是按地址对比的，为什么呢？因为作为框架，我们并不知道要不对的对象中的类的结构内容是什么，作为一般性的框架结构，我们要普遍化，好了又扯多了，如果地址相等，我们就认为你是存在这个集合中的，返回true就行了，如果便利了所有还没有相等的，就认为是没有,则返回false
至于如何便利，这个我不用多说了吧，for循环，或者是迭代器+while嘛?我们常用的就是这两种嘛。

官方是如何实现的呢，人家是神级的任务，肯会有硬货哦。赶紧看看，

 public boolean contains(Object o) {
        Iterator<E> it = iterator();
        if (o==null) {
            while (it.hasNext())
                if (it.next()==null)
                    return true;
        } else {
            while (it.hasNext())
                if (o.equals(it.next()))
                    return true;
        }
        return false;
    }

额。。。好像和我们的差不多哦。。。哈哈哈，其实就是这样，道理和算法都很朴实，实现方式也就如此，是不是发现你和大神的距离瞬间很近了。

好嘞，我们在看一个：

 public Object[] toArray() {
        // Estimate size of array; be prepared to see more or fewer elements
        Object[] r = new Object[size()];
        Iterator<E> it = iterator();
        for (int i = 0; i < r.length; i++) {
            if (! it.hasNext()) // fewer elements than expected
                return Arrays.copyOf(r, i);
            r[i] = it.next();
        }
        return it.hasNext() ? finishToArray(r, it) : r;
    }

这个方法是干什么的？看名字就知道，就是将集合转换成数组嘛，既然是数组，我们就要搞一个数组出来嘛。于是我们就new了一个数组出来.这个数组的大小肯定是集合的大小了，就是size()。

Object[] r = new Object[size()];

然后怎么办呢？然后我们是不是要遍历这个集合。把集合里面的元素一个一个的添加到数组中，最后返回出去呢？

 Iterator<E> it = iterator();
        for (int i = 0; i < r.length; i++) {
            if (! it.hasNext()) // fewer elements than expected
                return Arrays.copyOf(r, i);
            r[i] = it.next();
        }

在这里我们可以看出jdk的设计人员并不是遍历这个集合，而是遍历我我们预先定义好的数组，为什么是这样的呢？
我的认为是这样的：首先遍历一个集合是一个谨慎的事，为什么？因为，在多线程操作中，集合的大小可能会随时会发生改变，我们无法准确的知道在我们调用toArray()之后，集合的内容是否发生了改变，如果集合增加了，这个问题还不严重，但是如果集合减少了，就会在循环的时候发生越界访问异常，有人会说我使用迭代器访问没事啊，这里也有一个问题，就是空间的浪费问题，你会发现我们返回的数组不是满数组，jdk设计人员在综合了两者之后，使用for循环遍历定义的数组，使用迭代器遍历集合，同时返回截取后的有数据的数组。

这里这个我们就可以看出自己和jdk设计者的差距，别人的严谨性，考虑问题的全面性。

有人又要问了，这个只能解决在遍历过程中，集合可能发生减少的情况，那么如果发生了增加，又该如何是好呢？别急。。。，我们看到如果集合发生了增加，我们会发现，

 if (! it.hasNext()) // fewer elements than expected
                return Arrays.copyOf(r, i);

这段代码不会执行，而是进入了下面的代码

 return it.hasNext() ? finishToArray(r, it) : r;

这句代码是什么意思呢？就是说我将数组全部遍历完成了，发现集合中没有下一个元素了，就直接返回我们原来的数组（代码执行到这一步是集合没有发生过改变，数组的大小和集合的大小是一致的），如果还有元素没有加入数组，这就坏事了，是不是。怎么办呢？
代码告诉了我们是调用finishToArray(r, it)，这又是是一个什么东西呢？参数是一个是将我们放有数据的数组传递了进去，然后又将我们的迭代器传递了进去。
我们想一下，如果是我们的话，里面如何实现呢？会有什么功能呢？首先它既然要单独处理，就是说要将剩余的数据还要一起加进数组，那我们的数组不够，怎么办呢？找一个更大的数组呗，然后将数据放里面嘛，话是没错，可是找多大的数组呢。额。。。这个懵逼了，哈哈哈，我们来看看jdk怎么做的.

 private static <T> T[] finishToArray(T[] r, Iterator<?> it) {
        int i = r.length;
        while (it.hasNext()) {
            int cap = r.length;
            if (i == cap) {
                int newCap = cap + (cap >> 1) + 1;
                // overflow-conscious code
                if (newCap - MAX_ARRAY_SIZE > 0)
                    newCap = hugeCapacity(cap + 1);
                r = Arrays.copyOf(r, newCap);
            }
            r[i++] = (T)it.next();
        }
        // trim if overallocated
        return (i == r.length) ? r : Arrays.copyOf(r, i);
    }

首先他将我们原来的数组长度用变量i存放起来，然后在使用迭代器找元素，但是我们在while循环里又搞了一个cap这个是什么呢？不急慢慢看，它判断我们的i是否等于cap这个不是扯淡吗，这个肯定的啊，初始赋值都是数组的长度吗，怎么不相等呢？这里不是多此一举吗？是吗？带着问题，我们继续看，接下来我们又看到了一个newCap,这个家伙等于cap + (cap >> 1) + 1，啥意思，从大小上看就是这个大小就是在cap的基础上加上cap的一半还多加一个1，哦。。。我猜想这个就是扩容数组了，是不是，带着第二个问题，继续看，它又判断newCap是不是大于MAX_ARRAY_SIZE的值，这个是什么鬼？

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

这个就是分配给数组的最大值，为了避免数组无限大的问题，看值我们就知道差不多够用了，再打就不是int能够表示的了,哈哈哈，小插曲，继续，我们假设不会超过，开始执行

 r = Arrays.copyOf(r, newCap);

是不是有点懂了，将数组开始扩容了，扩容后的新的数组，从新给了r，然后开始存放，我们的第二个问题猜想解决了，是正确的

r[i++] = (T)it.next();

最后在开始循环，那第一个问题呢，我们回头看看，发现当我们再次循环的时候，cap就不等于i。因为，i每次加1，而cap是不是一次加了(cap >> 1)+1啊，这里我们就知道了，为什么又要加1了吧，因为至少要加1啊，要不没有意义是不是呢？也就是说，当i==cap的时候，就是数组扩容的时候，就是说发现数组又不够用了，对吧。

下面我们看最后一段代码，这个也是防止过度扩容的，最后保证返回的数组是一个满数组吧。

return (i == r.length) ? r : Arrays.copyOf(r, i);

到这里我们还有最后一个问题没有处理，就是cap很不幸，真的很大，然后怎么办，代码中我们看到这样一句代码？

 newCap = hugeCapacity(cap + 1);

从形式上看它好像是对newCap进行了从新的定义分配，那到底是如何呢？看看代码实现。

private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError("Required array size too large");
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

我们看到 minCapacity < 0这个是什么呢？不是说这个minCapacity太小，反而是太大，我们知道计算机的数是有符号的，最高位是符号位，当一个数太大溢出了，表示的是符合为也有了数字1，这个时候这个数就是负数了，jdk直接返回内存溢出的异常，如果这个值在MAX_ARRAY_SIZE和Integer.MAX_VALUE之间的话，我们返回Integer.MAX_VALUE否则的话我们返回MAX_ARRAY_SIZE，这样我们就做了最精细的处理了。

到此我们就分析完了toArray() 这个方法的全部实现了，是不是感觉考虑的东西有点多呢？哈哈哈，要不你以为jdk设计者牛在哪呢？人家处处是细节啊，我们就是要从源码中学习，不是吗。

好了本次就分析到这里了，下次我们在继续。。。

最后编辑于：2020.04.03 14:22:37

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,607评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,047评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,496评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,405评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,400评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,479评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,883评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,535评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,743评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,544评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,612评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,309评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,881评论 3赞 306
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,891评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,136评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,783评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,316评论 2赞 342

Java ArrayList源码分析(一）

推荐阅读更多精彩内容