集合小记

List

List 元素是有序的、可重复,实现List接口的集合主要有:ArrayList、LinkedList、Vector、Stack。

ArrayList:动态数组;默认容量为10,每次增加元素时会进行容量检查,当容量到达size-1时进行扩容(add(E e)中先调用了ensureCapacity(size+1)方法,之后将元素的索引赋给elementData[size],而后size自增),扩容0.5倍+1,如 ArrayList的容量为10,一次扩容后是容量为16;非同步,查询速度快,擅长于随机访问( size、isEmpty、get、set、iterator 和 listIterator );线程安全的arraylist:Collections.synchronizedList(List l)函数返回一个线程安全的ArrayList类(synchronized代码块),也可以使用concurrent并发包下的CopyOnWriteArrayList类(add、remove方法:final ReentrantLock lock = this.lock;lock.lock();)。

LinkedList双向链表;非同步,通过较低的代价在List中进行插入和删除操作(get,remove,insert)(prev,next)。

Vector:数组;默认容量为10,加载因子为1:即当元素个数超过容量长度时,进行扩容扩容增量:原容量的1倍,如 Vector的容量为10,一次扩容后是容量为20;同步(源代码中Vector的成员方法都加了synchronized)。

Stack:Stack继承自Vector(基本的push和pop 方法,还有peek方法得到栈顶的元素,empty方法测试堆栈是否为空,search方法检测一个元素在堆栈中的位置)。

SET

Set是一种不包括重复元素的Collection,实现了Set接口的集合有:EnumSet、HashSet、TreeSet。

EnumSet:是枚举的专用Set。所有的元素都是枚举类型。

HashSet: 堪称查询速度最快的集合,底层实现是一个HashMap(保存数据)(HashSet所有的构造都是构造出一个新的HashMap),实现Set接口,内部以HashCode来实现的。它内部元素的顺序是由哈希码来决定的,所以它不保证set 的迭代顺序;特别是它不保证该顺序恒久不变;默认初始容量为16,加载因子为0.75,扩容增量:原容量的1倍;线程不安全,存取速度快

TreeSet基于TreeMap,内部以TreeMap来实现。它是使用元素的自然顺序对元素进行排序,或者根据创建Set 时提供的Comparator 进行排序,具体取决于使用的构造方法。

MAP

Map是一个双列集合,没有继承Collection,实现map的有:HashMap、TreeMap、HashTable、Properties、EnumMap。

HashMap:以哈希表数据结构实现,查找对象时通过哈希函数计算其位置,它是为快速查询而设计的,其内部定义了一个hash表数组(Entry[] table),元素会通过哈希转换函数将元素的哈希地址转换成数组中存放的索引,如果有冲突,则使用散列链表的形式(JDK8 中哈希冲突过多,链表会转红黑树)将所有相同哈希地址的元素串起来(冲突的节点放在链表的最下面),通过查看HashMap.Entry的源码它是一个单链表结构(数组(散列桶)与链表的组合体);默认初始容量为16,加载因子为0.75,扩容增量:原容量的1倍;线程不安全,Collections类中存在一个静态方法:synchronizedMap(),该方法创建了一个线程安全的Map对象;基于AbstractMap;允许存在一个为null的key和任意个为null的value( 当HashMap遇到为null的key时,它会调用putForNullKey方法来进行处理。对于value没有进行任何处理,只要是对象都可以)。

TreeMap:键以某种排序规则排序,内部以red-black(红-黑)树数据结构实现,实现了SortedMap接口。

HashTable:也是以哈希表数据结构实现的,解决冲突时与HashMap也一样也是采用了散列链表的形式;线程安全(synchronized方法);基于Dictionary类;key和value都不允许为null

Queue

队列,它主要分为两大类,一类是阻塞式队列,队列满了以后再插入元素则会抛出异常,主要包括ArrayBlockQueue、PriorityBlockingQueue、LinkedBlockingQueue。另一种队列则是双端队列,支持在头、尾两端插入和移除元素,主要包括:ArrayDeque、LinkedBlockingDeque、LinkedList。

小结:

对List的选择:

  • 对于随机查询与迭代遍历操作,数组比所有的容器都要快。所以在随机访问中一般使用ArrayList
  • LinkedList使用双向链表对元素的增加和删除提供了非常好的支持,而ArrayList执行增加和删除元素需要进行元素位移
  • 对于Vector而已,我们一般都是避免使用
  • 将ArrayList当做首选,毕竟对于集合元素而已我们都是进行遍历,只有当程序的性能因为List的频繁插入和删除而降低时,再考虑LinkedList

对Set的选择:

  • HashSet由于使用HashCode实现,所以在某种程度上来说它的性能永远比TreeSet要好,尤其是进行增加和查找操作
  • 虽然TreeSet没有HashSet性能好,但是由于它可以维持元素的排序,所以它还是存在用武之地的

对Map的选择:

  • HashMap与HashSet同样,支持快速查询。虽然HashTable速度的速度也不慢,但是在HashMap面前还是稍微慢了些,所以HashMap在查询方面可以取代HashTable
  • 由于TreeMap需要维持内部元素的顺序,所以它通常要比HashMap和HashTable慢

解決hash沖突
  开放定址法、拉链法

hash表解決沖突
  开放定址法、再哈希法、链地址法、建立公共溢出区

并发包中的线程安全的集合容器:

ConcurrentMap(线程安全的hashMap,key、value不允许为null),默认16个segment的数组,每个segment中实现就是hashMap了,通过hash定位segment。put操作是在segment层上加锁的,这样可以减少并发的冲突;读操作大多数情况下无锁操作(仅仅找到的hashentry对应的对象为null时,有锁操作)

CopyOnWriteArrayList,线程安全,读操作时无锁的ArrayList;在写时,copy一个ArrayList,写完成后,指针指向新的对象

CopyOnWriteArraySet,基于CopyOnWriteArrayList实现。
  ArrayBlockQueue,基于数组,FIFO,线程安全的集合类,容量可以限制。

ConcurrentHashMap

jdk1.7中采用 Segment + HashEntry 的方式进行实现,** Segment大小默认为16**
  场景: 线程 A和线程B同时执行相同 Segment 对象的
  put 方法
  1. 线程A执行 tryLock() 方法成功获取锁,则把 HashEntry 对象插入到相应的位置;
  2. 线程B获取锁失败,则执行 scanAndLockForPut() 方法,在 scanAndLockForPut 方法中,会通过重复执行 `tryLock() 方法尝试获取锁,在多 处理器 环境下,重复次数为64,单处理器重复次数为1,当执行 tryLock() 方法的次数超过上限时,则执行 lock() 方法挂起线程B;
  3. 当线程A执行完插入操作时,会通过 unlock() 方法释放锁,接着唤醒线程B继续执行;

size计算:先采用不加锁的方式,连续计算元素的个数,最多计算3次:
  1. 如果前后两次计算结果相同,则说明计算出来的元素个数是准确的;
  2. 如果前后两次计算结果都不同,则给每个 Segment 进行加锁,再计算一次元素的个数;

1.8中放弃了 Segment 臃肿的设计,取而代之的是采用Node+CAS+ Synchronized 来保证并发安全进行实现,只有在执行第一次put方法时才会调用 initTable() 初始化Node数组
  当执行 put 方法插入数据时,根据key的hash值,在 Node 数组中找到相应的位置,实现如下:
  1. 如果相应位置的 Node 还未初始化,则通过CAS插入相应的数据;
  2. 如果相应位置的 Node 不为空,且当前该节点不处于移动状态,则对该节点加 synchronized 锁,如果该节点的 hash 不小于0,则 遍历 链表更新节点或插入新节点;
  3. 如果该节点是 TreeBin 类型的节点,说明是红黑树结构,则通过 putTreeVal 方法往红黑树中插入节点;
  4. 如果 binCount 不为0,说明 put 操作对数据产生了影响,如果当前链表的个数达到8个,则通过 treeifyBin 方法转化为红黑树,如果 oldVal 不为空,说明是一次更新操作,没有对元素个数产生影响,则直接返回旧值;
  5. 如果插入的是一个新节点,则执行 addCount() 方法尝试更新元素个数 baseCount ;

size实现
  1.8中使用一个** volatile 类型的变量** baseCount 记录元素的个数,当插入新数据或则删除数据时,会通过 addCount() 方法更新 baseCount ,实现如下:
  1. 初始化时 counterCells 为空,在并发量很高时,如果存在两个线程同时执行 CAS 修改 baseCount 值,则失败的线程会继续执行方法体中的逻辑,使用 CounterCell 记录元素个数的变化;
  2. 如果 CounterCell 数组 counterCells 为空,调用 fullAddCount() 方法进行初始化,并插入对应的记录数,通过 CAS 设置cellsBusy字段,只有设置成功的线程才能初始化 CounterCell 数组,实现如下:
  3. 如果通过 CAS 设置cellsBusy字段失败的话,则继续尝试通过 CAS 修改 baseCount 字段,如果修改 baseCount 字段成功的话,就退出循环,否则继续循环插入 CounterCell 对象;
  所以在1.8中的 size 实现比1.7简单多,因为元素个数保存 baseCount 中,部分元素的变化个数保存在 CounterCell 数组中,实现如下:
通过累加 baseCount 和 CounterCell 数组中的数量,即可得到元素的总个数;

CAS

要实现无锁(lock-free)的非阻塞算法有多种实现方法,其中 CAS(比较与交换,Compare and swap) 是一种有名的无锁算法。
  CAS有3个操作数,内存值V,旧的预期值A,要修改的新值B。当且仅当预期值A和内存值V相同时,将内存值V修改为B,否则什么都不做

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,723评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,485评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,998评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,323评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,355评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,079评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,389评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,019评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,519评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,971评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,100评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,738评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,293评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,289评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,517评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,547评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,834评论 2 345

推荐阅读更多精彩内容

  • 从三月份找实习到现在,面了一些公司,挂了不少,但最终还是拿到小米、百度、阿里、京东、新浪、CVTE、乐视家的研发岗...
    时芥蓝阅读 42,192评论 11 349
  • Java8张图 11、字符串不变性 12、equals()方法、hashCode()方法的区别 13、...
    Miley_MOJIE阅读 3,693评论 0 11
  • 从最基础的数据结构 数组|链表|树 开始,基于这些基础数据结构通过各种设计组合成具备特定功能的数据结构,这些结构是...
    轩居晨风阅读 1,204评论 2 31
  • 一、基本数据类型 注释 单行注释:// 区域注释:/* */ 文档注释:/** */ 数值 对于byte类型而言...
    龙猫小爷阅读 4,254评论 0 16
  • java笔记第一天 == 和 equals ==比较的比较的是两个变量的值是否相等,对于引用型变量表示的是两个变量...
    jmychou阅读 1,485评论 0 3