深入浅出!阿里P7架构师带你分析ArrayList集合源码,建议是先收藏再看!

ArrayList简介

ArrayList 是 Java 集合框架中比较常用的数据结构了。ArrayList是可以动态增长和缩减的索引序列,内部封装了一个动态再分配的Object[]数组

这里我们可以看到ArrayList继承抽象类AbstractList,实现了 List 接口,同时还实现了 RandomAccess、Cloneable、Serializable 接口,所以ArrayList 是支持快速访问、复制、序列化的。

主要成员变量

    // 底层存储元素的数组
    transient Object[] elementData; 
    // ArrayList的实际大小
    private int size;

注意:size 才是 elementData数组中实际的元素个数,而 elementData.length 为数组的容量,表示最多可以容纳多少个元素。

    // ArrayList的默认初始化容量
    private static final int DEFAULT_CAPACITY = 10;

ArrayList的默认初始容量大小为 10

    // 记录对List操作的次数
    protected transient int modCount = 0;

这个变量是定义在 AbstractList 中的,主要使用是在 Iterator,目的是防止在List在迭代的过程中被修改

    // 空的Object类型数组
    private static final Object[] EMPTY_ELEMENTDATA = {};
    // 空的Object类型数组
    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

两个空的数组有什么区别呢?简单来讲就是第一次添加元素(使用add方法)时知道elementData是从空的构造函数还是有参构造函数被初始化的。以便确认下一步的扩容机制

构造函数

ArrayList类共有三种构造函数:

  • 无参构造函数
  • 带有参数为初始容量initialCapacity的构造函数
  • 带有参数为Collection集合的构造函数

1、无参构造函数

    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

注意:虽然在源码的注释中说该构造函数构造一个容量大小为 10 的空的ArrayList,但实际上构造函数只是给 elementData 赋值了一个空的数组(DEFAULTCAPACITY_EMPTY_ELEMENTDATA),在第一次向ArrayList添加元素时容量才扩大至10的。

2、带有参数为初始容量initialCapacity的构造函数

    public ArrayList(int initialCapacity) {
        // 如果initalCapacity大于0,直接创建一个长度Object数组赋值为elementData;
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        }
        // 如果initalCapcity等于0,直接将空数组EMPETY_ELEMENTDATA复制给elementData
        else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        }
        // 如果initalCapcity小于于0,则抛出异常IllegalArgumentException
        else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

当 initialCapacity 为0时则是把 EMPTY_ELEMENTDATA 赋值给 elementData。 当 initialCapacity 大于零时初始化一个大小为 initialCapacity 的 object 数组并赋值给 elementData。

3、带有参数为Collection集合的构造函数

   public ArrayList(Collection<? extends E> c) {
        // 将 Collection 转化为数组并赋值给elementData
        elementData = c.toArray();
        // 把elementData中元素的个数赋值给size并判断其是否为0
        if ((size = elementData.length) != 0) {
            // 如果 size 不为零,则判断 elementData 的 class 类型是否为 Object[],不是的话则做一次转换。
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } 
        // 如果 size 为零,则把 EMPTY_ELEMENTDATA 赋值给 elementData,相当于new ArrayList(0)。
        else {
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

该构造方法主要就是将Collection集合的实现类转换为ArrayList。

主要操作方法

add方法(添加单个元素)

    public boolean add(E e) {
        // 先确认ArrayList集合容量大小
        ensureCapacityInternal(size + 1);
        // 先给elementData中size位置赋值为e,然后size自增 
        elementData[size++] = e;
        return true;
    }

    private void ensureCapacityInternal(int minCapacity) {
    // 如果elementData为默认的空数组,则给minCapacity赋值为初始的默认容量
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    // modCount自增,并确定容量大于数组的长度
    ensureExplicitCapacity(minCapacity);
    }

    private void ensureExplicitCapacity(int minCapacity) {
    // modCount自增,修改次数加1
    modCount++;
    // 如果minCapacity超过了数组长度,则进行扩容
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
    }

上述三个函数的调用关系很简单,也很清楚。

  • 在add方法中,每次添加元素到ArrayList中时都会先确认下集合容量大小,然后将size位置的元素赋值为e,size再进行自增。
  • 在ensureCapacityInternal方法中先对elementData进行判断 ,如果elementData为 DEFAULTCAPACITY_EMPTY_ELEMENTDATA 就取 DEFAULT_CAPACITY 和 minCapacity 的最大值也就是10。这就是 EMPTY_ELEMENTDATA 与 DEFAULTCAPACITY_EMPTY_ELEMENTDATA 的区别所在。同时也验证了上面的说法:使用无参构造函数时是在第一次添加元素时初始化容量为10
  • ensureExplicitCapacity 方法中首先对modCount 自增1,记录操作次数,然后如果 minCapacity 大于 elementData 的长度,则对集合进行扩容。显然当第一次添加元素时 elementData 的长度为零。那我们来看看 grow 函数。
    private void grow(int minCapacity) {
    // ArrayList的旧容量为数组长度
    int oldCapacity = elementData.length;
    // 将新容量赋值为原容量的1.5倍(左移一位相当于除以二)
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    // 如果此时新容量还是小于添加元素后的容量,则将新容量直接赋值为添加元素后的容量
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    // 如果此时新容量大于数组的最大大小,则返回上限最大的容量
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // 把旧的数组elementData拷贝到新的elementData,并将容量设置为newCapacity
    elementData = Arrays.copyOf(elementData, newCapacity);
}

默认将list的容量扩容至原来容量的 1.5 倍。但是扩容之后也不一定适用,有可能太小,有可能太大。所以才会有下面两个 if 判断。如果1.5倍太小的话,则将增加元素的容量大小赋值给newCapacity如果1.5倍太大或者我们需要的容量太大,则调用hugeCapacity函数,给newCapacity赋一个合适的值。最后将原数组中的数据复制到大小为 newCapacity 的新数组中,并将新数组赋值给 elementData

    private static int hugeCapacity(int minCapacity) {
        // 如果minCapacity小于0,就抛出异常
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        // 如果此时增加元素后得minCapacity大于数组的最大长度就返回整数最大值,否则返回数组最大值
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

add方法(批量添加,在指定位置添加)

public void add(int index, E element) {
    // 检查index是否越界
    rangeCheckForAdd(index);
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    System.arraycopy(elementData, index, elementData, index + 1, size - index);
    elementData[index] = element;
    size++;
}

public boolean addAll(Collection<? extends E> c) {
    Object[] a = c.toArray();
    int numNew = a.length;
    ensureCapacityInternal(size + numNew);  // Increments modCount
    System.arraycopy(a, 0, elementData, size, numNew);
    size += numNew;
    return numNew != 0;
}

public boolean addAll(int index, Collection<? extends E> c) {
    rangeCheckForAdd(index);

    Object[] a = c.toArray();
    int numNew = a.length;
    ensureCapacityInternal(size + numNew);  // Increments modCount

    int numMoved = size - index;
    if (numMoved > 0)
        System.arraycopy(elementData, index, elementData, index + numNew, numMoved);

    System.arraycopy(a, 0, elementData, index, numNew);
    size += numNew;
    return numNew != 0;
}

这三个方法基本思路与上述add方法基本思路是一致,博主这里就不再赘述了。

remove方法

public E remove(int index) {
    // 检查index是否越界,如果越界则抛出异常
    rangeCheck(index);
    // modCount自增,修改次数加一
    modCount++;
    // 获取elementData在index位置的值
    E oldValue = elementData(index);
    // 获取后移的位置长度
    int numMoved = size - index - 1;
    // 如果大于零,则调用System.arraycopy方法完成数组移动
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index, numMoved);
    // size自减,并将elementData索引值为size的元素引用赋值为空,让GC对他进行回收
    elementData[--size] = null; 
    // 返回index位置的值
    return oldValue;
}

当我们调用 remove(int index) 时,首先会检查 index 是否合法,然后再判断要删除的元素是否位于数组的最后一个位置。如果 index 不是最后一个,就再次调用 System.arraycopy() 方法拷贝数组。说白了就是将从 index + 1 开始向后所有的元素都向前挪一个位置。然后将数组的最后一个位置空,size - 1。如果 index 是最后一个元素那么就直接将数组的最后一个位置空,size - 1即可。

public boolean remove(Object o) {
    // 如果o为空,则查找数组中为空的索引,并调用fastRemove方法进行删除,并返回true
    if (o == null) {
        for (int index = 0; index < size; index++)
            if (elementData[index] == null) {
                fastRemove(index);
                return true;
            }
    }
    // 如果o不为空,则查找数组中与该元素相等的索引,并调用fastRemove方法进行删除,并返回true 
    else {
        for (int index = 0; index < size; index++)
            if (o.equals(elementData[index])) {
                fastRemove(index);
                return true;
            }
    }
    // 如果list中不存在则返回false
    return false;
}

下面我们在看fastRemove方法,fastRemove方法相较于remove(int index)方法少了一步对index的判断,因为remove(Object o)就是在数组中进行查询一定是合法的,所以在fastRemove中没必要对index进行判断。

private void fastRemove(int index) {
    modCount++;
    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,numMoved);
    elementData[--size] = null; // clear to let GC do its work
}

get方法

public E get(int index) {
        // 检查index是否合法,是否越界
        rangeCheck(index);
        // 利用数组的特点,直接访问数组中该索引位置上的元素
        return elementData(index);
}

总结

  • ArrayList可以存放null。
  • ArrayList本质上就是一个elementData数组。
  • ArrayList区别于数组的地方在于能够自动扩展大小,其中关键的方法就是gorw()方法。
  • ArrayList中removeAll(collection c)和clear()的区别就是removeAll可以删除批量指定的元素,而clear是全是删除集合中的元素。
  • ArrayList由于本质是数组,所以它在数据的查询方面会很快,而在插入删除这些方面,性能下降很多,有移动很多数据才能达到应有的效果
  • ArrayList实现了RandomAccess,所以在遍历它的时候推荐使用for循环。

最后

欢迎关注公众号:前程有光,领取一线大厂Java面试题总结+各知识点学习思维导+一份300页pdf文档的Java核心知识点总结!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,189评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,577评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,857评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,703评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,705评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,620评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,995评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,656评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,898评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,639评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,720评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,395评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,982评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,953评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,195评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,907评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,472评论 2 342

推荐阅读更多精彩内容