为什么有时候要避免使用ArrayList
在工程中,经常能看到类似如下代码:
final List<String> list1 = ...;
final List<String> list2 = ...;
final List<String> results = new ArrayList<>(list1.size() + list2.size());
results.addAll(list1);
results.addAll(list2);
return results;
其功能非常简单,将两个list合并成一个list,而完成这个功能非常简单,就是使用一个ArrayList,将两个list中的元素全部加入到这个list中。
但是这样做的问题在于以下两点:
- 时间开销大,需要将两个list中的元素全部加入到新的list中
- 需要创建额外的数组空间,甚至在加入第二个list时,ArrayList需要扩容
可以看到ArrayList中的代码:
这两段ArrayList中的代码并没有问题,只不过在这样的场景下并不是最优的。
我们再看看我们常用的Arrays.asList()方法是如何实现的:
可以看到,Arrays.asList()方法中创建了一个ArrayList,但是此ArrayList并不是java.util.ArrayList,而是Arrays的一个静态类部类,从截图中的代码可以看出,Arrays.asList()方法没只有O(1)的时间开销,并且没有创建额外的数组。
回到前面的例子,我们怎么将两个list合并成一个list并返回呢,类似的,我们可以使用AbstractList:
很多类似的场景都非常适合使用AbstractList而不是ArrayList,比如Guava中的Lists..asList()的代码:
AbstractList
AbstractList类是专为继承而设计的类,其中提供了get和size两个抽象方法,子类最小只需要实现这两个方法即可,但这样创建出来的List是不支持修改的,我们可以看看ArrayList的源码,其中的set/add/remove方法如下:
如果想要通过AbstractList派生出来的List支持修改,需要覆盖这三个方法
AbstractList作为List的抽象实现,其脱离了具体的数据结构,提供了不同类型的数据结构实现的List所需要的通用方法,在AbstractList提供的默认实现中,在特定场景下可能会有性能上的不足,比如addAll方法:
如果是链表结构的List,此方法性能将非常低,时间开销会是O(n*m),n和m是两个list的长度。而LinkedList中则选择了覆盖此方法,利用链表的尾插法重新实现了此方法从而保证了性能。同样ArrayList也重新实现了addAll方法,前文中可以看到,通过复制数组的方式代替遍历的方式
AbstractCollection
最后看看AbstractCollection,AbstractCollection提供了Collection的抽象实现,Collection接口包含Set接口和List接口,因此Collection中无法判断出集合是有序的(List)还是无序的(Set),因此AbstractCollection中没有提供迭代器的默认实现,而AbstractList中提供了迭代器的默认实现:
而在AbstractCollection接口提供的方法实现基本上都是基于迭代器的:
因此在AbstractCollection的子类中,也可能会出现AbstractCollection提供的方法有性能优化的空间,比如把迭代器替换成arraycopy等
AbstractSet
最后看一下AbstractSet类,同样,AbstractSet中并没有提供迭代器的默认实现,其中只是对removeAll做了重新实现,并覆盖了hashcode和equals