Java基础数据结构及源码分析

前言:所有数据结构以及源码相关内容基于jdk1.8版本。对常见的数据结构进行解释以及对常见方法进行源码解读。

ArrayList

ArrayList底层数据结构较为简单

// 底层为数组结构 所有数据均存储在elementData数组中
transient Object[] elementData;

底层为数组结构决定了该集合的优缺点:

优点:

有序,有索引。
可以根据索引直接获取对应的元素,同时数组结构根据索引定位元素性能高,因此查询快。

缺点:

数组长度是固定的,导致每次add元素都需判断长度是否满足,如果不满足需要扩容数组,扩容的过程其实效率比较低(后面会通过源码分析扩容过程)。
随机插入或者删除元素会导致数据内容大范围移动,效率低。

这就是常说的ArrayList查询快 增删慢

源码剖析

构造函数剖析

    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

    /**
     * Constructs an empty list with an initial capacity of ten.
     */
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

首先,通过源码注释可以了解到,当使用无参构造的时候会初始化一个长度为10的空数据,但是实际源码发现刚初始化出来的数组其实长度是0。而真正初始化该数据的位置其实是在add方法中。后面讲到add方法的时候再做详细说明。

有参构造

    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
     /**
     * Constructs an empty list with the specified initial capacity.
     *
     * @param  initialCapacity  the initial capacity of the list
     * @throws IllegalArgumentException if the specified initial capacity
     *         is negative
     */
    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

通过以上源码我们可以发现,当传入一个容量长度的时候,会初始化一个对应长度的数组,如果传入的长度为0则相当于使用了无参构造。如果传入的为负数则会抛出非法参数异常。

add(E e)源码剖析

    /**
     * Appends the specified element to the end of this list.
     *
     * @param e element to be appended to this list
     * @return <tt>true</tt> (as specified by {@link Collection#add})
     */
    public boolean add(E e) {
        // 长度动态判断以及扩容的方法,是ArrayList的核心方法
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        // 长度满足之后会直接将传递进来的数据 赋值给size对对应的索引位置。
        // 同时让当前集合的size+1 注意集合的长度是size,并不是集合中数组的长度,这里要特别注意
        elementData[size++] = e;
        return true;
    }

以上代码不难看出,ArrayList对数据的存储就是把元素放到数组中。
接下来主要看这个核心扩容的方法代码。
这段代码方法较多,为了方便阅读,直接通过注释来解析。

    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
    // 最大数组长度
    private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
    
    // 数组默认容量长度
    private static final int DEFAULT_CAPACITY = 10;
    
    protected transient int modCount = 0;
   
    // 核心确保数组容量的方法,主要功能有计算当前所需的容量值,以及如果容量不够完成扩容操作。
    private void ensureCapacityInternal(int minCapacity) {
        // calculateCapacity方法用于计算当前所需容量
        // ensureExplicitCapacity方法用于扩容
        ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
    }

    private static int calculateCapacity(Object[] elementData, int minCapacity) {
        // 首先结合之前看到的无参构造的例子来讲
        // 无参构造初始化的数组其实就是一个{}空数组其实就是DEFAULTCAPACITY_EMPTY_ELEMENTDATA
        // 因此这里判断成立。而此时minCapacity = size + 1 默认数组长度为0,因此minCapacity值为1。
        // 到此 可以看到 如果使用无参构造,计算容量的方法返回的值为DEFAULT_CAPACITY = 10。
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            return Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        // 此时再看另外一种情况,假设使用有参构造初始化的一个长度为20的数组,
        // 上面的判断条件就不满足,就会直接返回传递过来的minCapacity = size + 1 ,
        return minCapacity;
    }

    // 当计算出来当前数组所需的长度之后执行该方法完成数组的扩容操作
    private void ensureExplicitCapacity(int minCapacity) {
        // modCount该值没有实际的业务含义,只要的作用就是为了防止在使用迭代器遍历的时候对数组做增删操作,会根据该值的变化抛出并发修改异常
        modCount++;
        
        // 当计算出来当前数组应有的容量比当前数组现有长度要大的时候来完成数组的扩容操作,否则不进行任何操作。
        // 当使用无参构造初始化数组的时候,默认数组长度为0,而计算出来的数组长度为默认的长度10,所以这里就会直接调用grow方法来完成数据的扩容操作
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

    // 数组的扩容方法
    private void grow(int minCapacity) {
        // 记录扩容之前数组的长度
        int oldCapacity = elementData.length;
        // 根据之前数组的长度,计算扩容之后的数组长度。这里用到了位运算,如果对位运算有了解的应该不难看出,这个扩容系数大致就是0.5。
        // 假定当前老数组长度为10 10的二进制为 1010 右移一位之后变成0101 换算回来就是5 , 10+5 = 15.
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        // 判断当前传递过来数组的最小应有长度和扩容之后的长度,取较大值。
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        // 如果当前算出来的扩容长度大于最大数组长度 Integer.MAX_VALUE - 8(一般不会有这么长的数组),则会使用hugeCapacity方法来限定一个大小。
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // 最终调用Arrays工具类的复制方法来完成数组的扩容。这个方法会先初始化一个newCapacity长度的数组,
        // 再把elementData中的数据拷贝过去,这里就是比较耗时,耗内存的地方。
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

    // 该方法比较简单自己阅读。
    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

add(int indec,E e)源码剖析

    public void add(int index, E element) {
        // 校验传入的index合法性方法,如果传入的索引小于0或者大于当前数组的size则会抛出索引越界异常
        rangeCheckForAdd(index);
        // 和上面add方法扩容一样。
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        // 调用系统的native方法完成数组的拷贝操作。
        // 从elementData数组索引为index的位置开始拷贝,讲数据拷贝到index+1的位置,拷贝的长度为size-index
        // 例如当前数组内容为["a","b","c","d","e","","","","",""],此时调用add(1,"f")方法。
        // 则拷贝之后的内容为["a","b","b","c","d","e","","","",""]
        System.arraycopy(elementData, index, elementData, index + 1,
                         size - index);
        // 拷贝完成之后在给对应index位置元素值做一次覆盖,覆盖之后数组的值为      ["a","f","b","c","d","e","","","",""]
        // 由此可以看出这种对应索引位置的插入会导致整个数组发生拷贝,大部分数据位置发生移动。
        elementData[index] = element;
        size++;
    }

    private void rangeCheckForAdd(int index) {
        if (index > size || index < 0)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }

set(int index,E e)源码剖析

    public E set(int index, E element) {
        rangeCheck(index);

        E oldValue = elementData(index);
        elementData[index] = element;
        return oldValue;
    }

    private void rangeCheck(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }       

以上代码就比较简单,就是直接的值覆盖对应索引位置的值,并返回旧值。

remove(int index)源码剖析

    public E remove(int index) {
        rangeCheck(index);

        modCount++;
        E oldValue = elementData(index);

        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work

        return oldValue;
    }

和上面的代码基本类似,同样使用System.arraycopy来拷贝元素,相当于把要删除的索引位置的元素用后面index+1开始的索引元素整体前移了一位。

remove(E e)源码剖析

    public boolean remove(Object o) {
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }

    private void fastRemove(int index) {
        modCount++;
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work
    }

这里的移除和之前的一样都是使用复制的方式来覆盖内容。只不过移除的时候需要整体遍历元素找到需要移除的值对应的索引。

get方法源码

    public E get(int index) {
        rangeCheck(index);

        return elementData(index);
    }

get方法的源码非常简单。直接就是去数组对应索引的元素。

到这里ArrayList相关常用的api源码差不多就分析完了。看完源码后应该更能体会ArrayList查询快,增删慢的原因了。
接下来继续来看LinkedList以及Map相关的一些api。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,839评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,543评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,116评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,371评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,384评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,111评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,416评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,053评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,558评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,007评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,117评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,756评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,324评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,315评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,539评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,578评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,877评论 2 345

推荐阅读更多精彩内容