通过上一篇文章的内容,我们简单了解了集合的框架。从本章开始,我们将开始分析集合的具体的实现类。我们先从ArrayList开始。
ArrayList的定义
先看一下ArrayList的定义:
public class ArrayList<E> extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{}
具体分析一下:
1、继承了AbstractList,实现了List接口,即拥有List基本的添加、删除及修改等等。并且部分方法因为继承了AbstractList,所以也无需重写。
2、实现了RandomAccess接口,RandomAccess支持快速(通常是恒定时间)随机访问。所以,ArrayList也支持快速的随机访问。
3、实现了Cloneable接口,即支持clone。
4、实现了Serializable接口,即可以序列化,可以通过序列化去传输数据。
注意,ArrayList是有大小的,随着列表中元素的增加,它会自动扩容。ArrayList不是线程安全的,如果多个线程同时访问ArrayList的实例,并且至少有一个线程在结构上修改了列表,则必须在外部同步。
接下来,我们就通过源码,一步步分析一下ArrayList。
ArrayList的源码简析
首先,是ArrayList的创建。它提供了三个构造函数:
//构造具有指定初始容量的空列表,初始容量可以理解为initialCapacity。
public ArrayList(int initialCapacity) {}
//构造一个初始容量为10的空列表
public ArrayList() {}
//构造一个包含指定集合元素的列表
public ArrayList(Collection<? extends E> c) {}
在这里,我们从无参的构造函数入手分析。在调用了无参构造函数后,会执行以下代码:
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
嗯?this.elementData是个啥?DEFAULTCAPACITY_EMPTY_ELEMENTDATA又是什么鬼?赶紧去属性声明的地方看一下。
transient Object[] elementData;
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
哦,就是初始化了一个空的数组。
注意:elementData是存储ArrayList元素的数组缓冲区。 ArrayList的容量是此数组缓冲区的长度。
size属性是动态数组的实际大小(接下来要用)。
欸?空的数组?那初始容量10是怎么来的?嗯。。。我们想一下,每次我们实例化完一个ArrayList之后,一般会干什么?是添加元素对吧。那我们去add()方法里看看:
public boolean add(E e) {
//确定数组大小
ensureCapacityInternal(size + 1); // Increments modCount!!
//将新元素加入数组
elementData[size++] = e;
return true;
}
我们看到他调用了一个ensureCapacityInternal()方法,并且,传递了一个参数"size + 1"。那这个方法是干嘛用的,又做了些什么事,我们去看看:
private static final int DEFAULT_CAPACITY = 10;
private void ensureCapacityInternal(int minCapacity) {
//判断当前数组是否为默认数组
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
//取10和minCapacity的最大值作为新的数组的长度,调用无参构造函数生成ArrayList的话,添加第一个元素时minCapacity是1
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
//根据minCapacity判断是否要对数组扩容
ensureExplicitCapacity(minCapacity);
}
private void ensureExplicitCapacity(int minCapacity) {
//将修改记录加1
modCount++
//判断数组当前容量是否可以容纳当前元素的个数
if (minCapacity - elementData.length > 0)
//当前容量无法容纳当前元素的个数,对数组扩容
grow(minCapacity);
}
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
private void grow(int minCapacity) {
//接下来的操作,就是通过一系列判断,对数组扩容
int oldCapacity = elementData.length;
//右移一位可以理解为除以2,所以newCapacity扩容了oldCapacity的3/2
int newCapacity = oldCapacity + (oldCapacity >> 1);
//如果minCapacity(新的元素个数)比newCapacity还大,则取minCapacity
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
//对数组扩容,拷贝原数组中的元素,将其放到一个新的容量为newCapacity的数组中,并返回新数组
elementData = Arrays.copyOf(elementData, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
//如果要创建的新的数组的长度小于0,抛出异常
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
//确定新建数组的长度
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
通过分析上面的源码,相信大家已经知道为什么默认长度是10了。也知道了ArrayList每次扩容都是原基础的3/2。
添加第一个元素时,任何带有elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA的空ArrayList都将扩展为DEFAULT_CAPACITY(DEFAULT_CAPACITY = 10)。
modCount主要由iterator()和listIterator()方法返回的迭代器和列表迭代器实现使用,是从AbstractList继承过来的一个属性,具体的后面会讲。
接下来的get()和set()方法就相对容易了,请看:
public E get(int index) {
//判断是否数组越界,数组越界就抛出异常
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
//返回指定位置的元素
return (E) elementData[index];
}
//
public E set(int index, E element) {
//判断是否数组越界,数组越界就抛出异常
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
//先用一个局部变量接收此位置的旧的元素
E oldValue = (E) elementData[index];
//在指定的位置添加新的元素,替换旧值
elementData[index] = element;
//返回修改之前的元素
return oldValue;
}
接下来我们分析一下remove(int index)方法:
public E remove(int index) {
//判断是否数组越界,越界则抛出异常
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
//数组修改次数加1
modCount++;
//获取index位置的当前的元素
E oldValue = (E) elementData[index];
//根据删除的元素的角标及数组的长度,判断要拷贝的数组长度
int numMoved = size - index - 1;
if (numMoved > 0)
//将修改后的数组拷贝到一个新的数组
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
//置空方便GC工作
elementData[--size] = null;
//返回移除掉的元素
return oldValue;
}
现在,我们分析完了一些常用的方法。接下来,我们再看一下刚开始说的ArrayList的clone:
public Object clone() {
try {
ArrayList<?> v = (ArrayList<?>) super.clone();
//复制数据
v.elementData = Arrays.copyOf(elementData, size);
//将操作数置为0
v.modCount = 0;
//返回克隆好的数组
return v;
} catch (CloneNotSupportedException e) {
// this shouldn't happen, since we are Cloneable
throw new InternalError(e);
}
}
以及序列化的读写:
//将ArrayList实例的状态保存到流中(即序列化它)。
private void writeObject(java.io.ObjectOutputStream s)
throws java.io.IOException{
// 写出数组中数据改变的次数等
int expectedModCount = modCount;
s.defaultWriteObject();
//写出数组的容量
s.writeInt(size);
// 按正确的顺序写出所有元素。
for (int i=0; i<size; i++) {
s.writeObject(elementData[i]);
}
if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
}
//从流中重构ArrayList实例(即反序列化它)。
private void readObject(java.io.ObjectInputStream s)
throws java.io.IOException, ClassNotFoundException {
elementData = EMPTY_ELEMENTDATA;
//读入数组大小等
s.defaultReadObject();
// 读入容量
s.readInt();
if (size > 0) {
//根据大小而不是容量来分配数组
ensureCapacityInternal(size);
Object[] a = elementData;
// 按正确的顺序读入所有元素
for (int i=0; i<size; i++) {
a[i] = s.readObject();
}
}
}
好了,ArrayList暂时就分析到这。其他的如果需要,后续再写。现在来总结一下:
1、ArrayList是通过elementData数组(Object类型)去操作数据的。这就是我们所说的,ArrayList的底层是数组,而且是一个动态数组。
2、使用无参的构造函数创建的ArrayList默认长度为10。当ArrayList的容量不足以容纳全部的元素,ArrayList会自己扩容:新的容量=3/2旧的容量。当然,容量最大不超过0x7fffffff(是一个16进制的数,值为:2^31 - 1,是最大的int数值)。
3、克隆,就是将已有的元素复制到一个新的数组
4、序列化的时候会先写入数组改变的次数以及数组的容量,然后再写入元素;反序列化的时候,会将数组大小即数组容量等全部读取出来,然后根据数组的大小来分配数组,最后读入所有的元素。
5、 ArrayList非线程安全。如果有并发修改,会抛出ConcurrentModificationException异常。这涉及到fail-fast机制,我们后面会讲到。
6、每次调用add()、addAll()方法时,如果元素个数超过了数组的当前容量,ArrayList都会去扩容,扩容需要将旧的元素拷贝到一个新的数组。所以,在可以知道最大容量的情况下,最好给ArrayList一个初始的容量值。
7、ArrayList为什么改、查快?因为它底层是数组,通过角标就可以改变或者查询对应位置的元素。为什么增、删慢?是因为增加、删除的操作会导致元素从旧的数组拷贝到一个新的数组。