今天我们来聊聊Java集合中的ArrayList,说起集合在我们编码过程中使用频率最高的了。这一点大家没有异议吧,接下来我们由浅入深逐步认识一下ArrayList。
1.Java集合的设计
上图是Java集合的设计层次和java类继承接口列表,Java设计策略先由接口定义集合应该具有的功能,接口设计完成后在具体类中实现具有这些功能的类。另外java集合提供了Collections工具类,它已经实现了对集合排序,遍历等算法,我们可以使用它,快速的完成集合的排序、遍历等功能。同样我们今天要聊到的ArrayList他继承List,拥有Collection接口定义的功能,同样可以使用Collections工具类对集合进行排序、遍历等。
2.ArrayList源码分析
关于ArrayList的原理,通过查看package java.util.ArrayList实现,下面截图部分是ArrayList的两个构造方法,一个是无参数一个是带有长度参数构造方法的代码,阅读代码我们可以发现ArrayList的底层是基于一个Object数组实现的。
既然知道了ArrayList底层是数组,故ArrayList拥有数组同样特性,比如可以通过索引获取指定位置的数据,也可以使用indexOf找到某个对象的索引位置。既然是数组在初始化创建对象的时候必须指定长度。
3.ArrayList扩容原理
源码中指定ArrayList的默认初始大小为10的数组,长度为10的Object数组很容易就装满了,如果增加的元素个数超过了10个,那么ArrayList底层会新生成一个数组,长度为原来数组的1.5倍+1,然后将原数组的内容复制到新数组中,并且后续增加的内容都会放到新数组当中,当新数组无法容纳增加的元素时,重复该过程。下图可以看到ArrayList扩容过程
JVM操作自动扩容的时候非常消耗性能,所以在选取使用ArrayList的时候最好事先估算一下它的长度,然后创建对象的时候传入估算的值。尽量避免ArrayList自动扩容,也有人会这样考虑,初始化ArrayList指定一个足够大的数据,虽然避免的自动扩容,但是造成内存的浪费。ArrayList既然是事先分配的数组,分配的数组每个项的长度是固定的,那么如何使用ArrayList存放复杂的对象呢?
4.ArrayList数据存储原理
ArrayList是一个Object数组,如果ArrayList存放基本类型,可以直接存放到数组中,但使用ArrayList存放对象,事先分配的Object无法存放形式和大小各异的对象,那么ArrayList进行了优化,在ArrayList集合中存放的是对象的引用,而不是对象本身。
ArrayList巧妙的使用存对象引用的方法解决了复杂对象的存取问题,这样的设计类似C++的指针,存取的索引地址可以方便方位索引位置的对象信息。
5.ArrayList插入和查询数据原理
接下来我们透过ArrayList的具体方法操作,看ArrayList是如何进行元素的收集的,因为ArrayList底层本质是数组,且实现了List接口,使用中可以方便调用List接口定义的add()功能向ArrayList添加内容。
可以发现,向ArrayList中插入数据,如果插入的数据位于数组末尾性能非常快,但是向数组中间插入就需要将插入位置后面的所有数据顺序后移,非常消耗性能,同理remove 集合ArrayList中的一个数据,也会导致冗长的移位操作,性能消耗得不偿失。所以对于ArrayList最好不要轻易改变带索引的数据。
知道了数据的增删之后,再来看看ArrayList进行数据访问是如何实现的?下图是ArrayList定义的获取值的方法
代码中ArrayList需要传入索引地址,方法定义通过索引随机访问数组索引位置的数据。它的访问时间复杂度O(1),性能非常的快。所以ArrayList适合一次加载多次访问的数据非常的适合。既然ArrayList在查询方面性能如此适合,那么可以直接使用ArrayList做多线程公共数据的查询服务吗?答案是不可以的。
6.ArrayList安全性浅析和应对方法
因为ArrayList是线程不安全的,ArrayList的操作并非是原子性的,通读ArrayList代码并没有实现线程同步机制的加锁约束。ArrayList添加一个元素的时候,需要两个步骤,第一步在Items[Size]的位置存放此元素,第二步增大Size的值,在单线程运行的情况,这两个步骤是顺序执行的,互相不会影响。但是如果有两个线程去操作呢?
线程A在0的位置赋了一个值,然后停下来,B线程ArrayList 0的位置又赋了一个值,其实是重复在一个位置赋值,然后回到A线程,执行Size增加,也就是ArrayList的大小增加了,原来Size是1,现在变成2,然后停下来继续执行线程B,又增加了一个空间位置,size大小就变成了3,结果就是0的位置有值,1和2的索引位置都没有值实际大小是3,跟想要的结果0和1赋不同的值,结果不对。那么如何来解决这个问题呢?
在JVM的ArrayList设计的时候给出了两个方法可以让程序员既能利用ArrayList的随机访问的高效性能,又能避免并发访问线程安全问题。
方法一、继承Arraylist,然后重写或按需求编写自己的方法,这些方法要写成synchronized,在这些synchronized的方法中调用ArrayList的方法。
方法二、使用Collections.synchronizedList的接口,如下使用:
List list =Collections.synchronizedList(new ArrayList());
方法一可以实现,但是对于程序开发者来说加大了工作难度,列在这里供参考。为了使用方便推荐直接使用方法二,因为Collections.synchronizedList已经实现了ArrayList的线程安全,所以不用重复造轮子了。
通过今天的分享希望大家对ArrayList有深入的了解。