常用的Java集合类,其简易的关系如下
更为复杂的实现/继承关系如下
【敲黑板,这个是重点】
各类的主要特点(底层数据结构、元素是否可以重复、数据存储是否有序、是否允许存储NULL等)如下
一些补充说明(大部分来自阿里Java开发手册):
关于ArrayList和LinkedList操作快慢的问题
ArrayList由于是数组,对于删除和修改而言消耗是比较大的(复制和移动数组实现);
LinkedList是双向链表删除和修改只需要修改对应的指针即可,消耗小。
因此一般来说LinkedList的增删速度是要比ArrayList快。
但是ArrayList的增删未必就一定比LinkedList要慢。
增删的时候两者的主要耗时分别在数组的移动、复制以及遍历链表寻找增删的具体位置上。
ArrayList增删时进行数组复制的操作,调用的是native方法arraycopy()。
当数据量极大,arraycopy()的速度能够快于链表遍历的情况下,ArrayList有可能比LinkedList快。
ArrayList的subList()方法的坑1
ArrayList的subList结果不可强转成ArrayList,否则会抛出ClassCastException 异常。
subList 返回的是 ArrayList 的内部类 SubList,并不是 ArrayList ,而是 ArrayList 的一个视图,对于 SubList 子列表的所有操作最终会反映到原列表上。
ArrayList的subList()方法的坑2
在 subList 场景中,高度注意对原集合元素个数的修改,会导致子列表的遍历、增 加、删除均产生 ConcurrentModificationException 异常
ArrayList的subList()方法的坑3
sublist里面存的是原list的一堆偏移量(起始值),它持有原list的强引用,是引发OOM的一个大隐患。
利用sublist引发OOM的例程如下:
/**
* 利用sublist引发OutOfMemory异常
*/
public class HowToGetOOM {
private static final int DATA_LIST_SIZE = 1000;
private static final int DATA_LIST_ITEM_SIZE = 1000000;
public static void main(String[] args) {
// 模拟外层的业务处理list,里面存放每一个数据list的前两项
List<List> resultList = new ArrayList<>();
List<Integer> dateItemList;
for (int i = 0; i < DATA_LIST_SIZE; i++) {
// 模拟向业务list提供数据的各个原始数据list,都是超大list
dateItemList = new ArrayList<>();
for (int j = 0; j < DATA_LIST_ITEM_SIZE; j++) {
dateItemList.add(j);
}
// 虽然原始数据list本身很大,但是每次通过sublist方法仅仅取第一和第二个元素
// 所以“理论上”resultList的内容应该很小才行
resultList.add(dateItemList.subList(0, 2));
System.out.println(resultList.size());
}
// 最终的结果就是:size很小时就会抛异常,因为强引用的关系,一大推超大数组未被释放
// Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
}
}
Arrays.asList()方法的坑
使用工具类 Arrays.asList()把数组转换成集合时,不能使用其修改集合相关的方 法,它的 add/remove/clear 方法会抛出 UnsupportedOperationException 异常。
因为 asList 的返回对象是一个 Arrays 内部类(适配器模式),并没有实现集合的修改方法,后台的数据仍是数组。
增删元素的注意事项
不要在 foreach 循环里进行元素的 remove/add 操作。remove 元素请使用 Iterator 方式,如果并发操作,需要对 Iterator 对象加锁。