ThreadPoolExecutor浅析

定义类

public class ThreadPoolExecutor extends AbstractExecutorService

重要变量

//线程池控制器
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
//任务队列
private final BlockingQueue<Runnable> workQueue;
//全局锁
private final ReentrantLock mainLock = new ReentrantLock();
//工作线程集合
private final HashSet<Worker> workers = new HashSet<Worker>();
//终止条件 - 用于等待任务完成后才终止线程池
private final Condition termination = mainLock.newCondition();
//曾创建过的最大线程数
private int largestPoolSize;
//线程池已完成总任务数
private long completedTaskCount;
//工作线程创建工厂
private volatile ThreadFactory threadFactory;
//饱和拒绝策略执行器
private volatile RejectedExecutionHandler handler;
//工作线程活动保持时间(超时后会被回收) - 纳秒
private volatile long keepAliveTime;
/**
 * 允许核心工作线程响应超时回收
 * false:核心工作线程即使空闲超时依旧存活
 * true:核心工作线程一旦超过keepAliveTime仍然空闲就被回收
 */
private volatile boolean allowCoreThreadTimeOut;
//核心工作线程数
private volatile int corePoolSize;
//最大工作线程数
private volatile int maximumPoolSize;
//默认饱和策略执行器 - AbortPolicy -> 直接抛出异常
private static final RejectedExecutionHandler defaultHandler =
        new AbortPolicy();

1 ThreadPoolExecutor的构造方法中各个参数

  • ThreadPoolExecutor是线程的真正实现,通常使用工厂类Executors来创建。
  • 但它的构造方法提供了一系列参数来配置线程池,下面我们就先介绍ThreadPoolExecutor的构造方法中各个参数的含义。
public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue workQueue,
                              ThreadFactory threadFactory) {
        this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
             threadFactory, defaultHandler);
    }

1.1 corePoolSize

  • 线程池的核心线程数
  • 在创建了线程池后,默认情况下,线程池中并没有 任何线程
  • 等待有任务到来才创建线程去执行任务,除非调用了prestartAllCoreThreads()或者 prestartCoreThread()方法,从这2个方法的名字就可以看出,是预创建线程的意思,即在没有任务到来之前就创建 corePoolSize个线程或者一个线程。
  • 默认情况下,核心线程数会一直在线程池中存活,即使它们处理闲置状态。
  • 如果将ThreadPoolExecutor的allowCoreThreadTimeOut属性设置为true,那么闲置的核心线程在等待新任务到来时会执行超时策略,这个时间间隔由keepAliveTime所指定,当等待时间超过keepAliveTime所指定的时长后,核心线程就会被终止。

1.2 maximumPoolSize

  • 线程池所能容纳的最大线程数量
  • (队列已满 && 实际工作线程数 < 最大工作线程数)时,线程池会创建新的工作线程(即使此时仍有空闲的工作线程)执行任务直到最大工作线程数为止;设置无界队列时该参数其实无效
  • 该值实际的可设置最大值不是Integer.MAX_VALUE,而是常量CAPACITY

1.3 keepAliveTime(工作线程最大空闲时间)

  • 满足超时条件且空闲的工作线程会被回收;超时的非核心工作线程会被回收,核心工作线程不会被回收;
  • 当allowCoreThreadTimeOut=true时,则超时的核心工作线程也会被回收;
  • 若该值没有设置则线程会永远存活;建议当场景为任务短而多时,可以调高时间以提高线程利用率
  • 默认情况下,只有当线程池中的线程数大于corePoolSize 时,keepAliveTime才会起作用,直到线程池中的线程数不大于corePoolSize。
  • 即当线程池中的线程数大于corePoolSize 时,如果一个线程空闲的时间达到keepAliveTime,则会终止,直到线程池中的线程数不超过corePoolSize。

1.4 unit

  • 用于指定keepAliveTime参数的时间单位
  • 这是一个枚举,常用的有
TimeUnit.DAYS;               //天  
TimeUnit.HOURS;             //小时  
TimeUnit.MINUTES;           //分钟  
TimeUnit.SECONDS;           //秒  
TimeUnit.MILLISECONDS;      //毫秒  
TimeUnit.MICROSECONDS;      //微妙  
TimeUnit.NANOSECONDS;       //纳秒  

1.5 workQueue

  • 线程池所使用的缓冲队列,该缓冲队列的长度决定了能够缓冲的最大数量。
  • (实际工作线程数 >= 核心工作线程数) && (任务数 < 任务队列长度)时,任务会offer()入队等待

1.6 threadFactory

  • 线程工厂,为线程池提供创建新线程的功能。
  • 如果没有另外说明,则在同一个 ThreadGroup 中一律使用 Executors.defaultThreadFactory() 创建线程,并且这些线程具有相同的 NORM_PRIORITY 优先级和非守护进程状态。
  • 通过提供不同的 ThreadFactory,可以改变线程的名称、线程组、优先级、守护进程状态等等。
  • 如果从 newThread 返回 null 时 ThreadFactory 未能创建线程,则执行程序将继续运行,但不能执行任何任务。

1.7 RejectExecutionHandler

  • 当线程池和队列都已满,此时说明线程已无力再接收更多的任务,即任务数饱和,没法接单了;此时需要使用一种饱和策略处理新提交的任务,默认是Abort(直抛Reject异常),还包括Discard(LIFO规则丢弃)、DiscardOldest(LRU规则丢弃) 以及 CallerRuns(调用者线程执行),允许自定义执行器
  • 有以下四种取值:
  • ThreadPoolExecutor.AbortPolicy:丢弃任务并抛出RejectedExecutionException异常。
  • ThreadPoolExecutor.DiscardPolicy:也是丢弃任务,但是不抛出异常。
  • ThreadPoolExecutor.DiscardOldestPolicy:丢弃队列最前面的任务,然后重新尝试执行任务(重复此过程)
  • ThreadPoolExecutor.CallerRunsPolicy:由调用线程处理该任务

2 ThreadPoolExecutor执行规则

2.1 ThreadPoolExecutor执行规则

微信图片_20171219150356.jpg

2.2 执行情况

随着任务数增加,线程池的执行情况主要有如下四种情况,分别对应处理流程中的各项判断:
1.若实际工作线程数workers<核心工作线程数corePoolSize,则创建新工作线程来执行新任务execute(Runable)

2.若实际工作线程数workers>=核心工作线程数corePoolSize(核心工作线程们都在执行任务)且任务队列workQueue未满,则将任务加入到任务队列workQueue中

3.若任务队列workQueue已满,则创建新工作线程来执行任务execute()

4.若实际工作线程数workers>=最大工作线程数maximumPoolSize(所有线程都在执行任务),此时任务数已饱和,需要根据饱和拒绝策略rejectedExecutionHandler执行相对应的饱和拒绝操作

线程池的总体设计是基于性能考虑,尽可能避免获取全局锁:
1.由于创建新线程时都需要获取全局锁,因此步骤1和步骤3必须加锁

2.为了避免多次获取全局锁(性能伸缩瓶颈),当实际工作线程数>=核心工作线程数时,之后会执行步骤2(入队时无须获取全局锁)

超时处理

若您需要处理超时的核心工作线程,选第二种;若不需要,选第一种:
1.若实际工作线程数workers>核心工作线程数corePoolSize,回收空闲时间超过keepAliveTime的空闲的非核心线程(减少工作线程数直到<=核心工作线程数即可)

2.若设置allowCoreThreadTimeOut为true时,则超过keepAliveTime的空闲的核心工作线程也会被回收

2.2 提交和执行任务

  1. execute():适用于提交无须返回值的任务
    -该方法是无法判断任务是否被线程池执行成功

  2. submit(): 适用于提交需要返回值的任务
    -可以通过返回的Future对象得知任务是否已经执行成功

-get()方法会阻塞当前线程直到任务完成,但要注意防范无限阻塞!!!

-使用get(long timeout,TimeUnit unit)方法会阻塞当前线程直到任务完成或超时,不会有无限阻塞的发生但需要注意超时后任务可能还没完成!!!

2 线程池的关闭

  • ThreadPoolExecutor提供了两个方法,用于线程池的关闭,分别是shutdown()和shutdownNow(),其中:
    1. shutdown(): 有序地关闭线程池,已提交的任务会被执行(包含正在执行和任务队列中的),但会拒绝新任务
    1. shutdownNow(): 立即(尝试)停止执行所有任务(包含正在执行和任务队列中的),并返回待执行任务列表
      注意:上述方法都可以通过调用 awaitTermination()等待任务完成后才终止线程池

合理配置线程池

要想合理的配置线程池的大小,首先得分析任务的特性,可以从以下几个角度分析:
1、任务的性质:CPU密集型任务、IO密集型任务、混合型任务。
2、任务的优先级:高、中、低。
3、任务的执行时间:长、中、短。
4、任务的依赖性:是否依赖其他系统资源,如数据库连接等。

性质不同的任务可以交给不同规模的线程池执行。

对于不同性质的任务来说,
CPU密集型任务应配置尽可能小的线程,如配置CPU个数+1的线程数,
IO密集型任务应配置尽可能多的线程,因为IO操作不占用CPU,不要让CPU闲下来,应加大线程数量,如配置两倍CPU个数+1,
而对于混合型的任务,如果可以拆分,拆分成IO密集型和CPU密集型分别处理,前提是两者运行的时间是差不多的,如果处理时间相差很大,则没必要拆分了。

若任务对其他系统资源有依赖,如某个任务依赖数据库的连接返回的结果,这时候等待的时间越长,则CPU空闲的时间越长,那么线程数量应设置得越大,才能更好的利用CPU。

高并发、任务执行时间短的业务怎样使用线程池?并发不高、任务执行时间长的业务怎样使用线程池?并发高、业务执行时间长的业务怎样使用线程池?
(1)高并发、任务执行时间短的业务,线程池线程数可以设置为CPU核数+1,减少线程上下文的切换
(2)并发不高、任务执行时间长的业务要区分开看:
  a)假如是业务时间长集中在IO操作上,也就是IO密集型的任务,因为IO操作并不占用CPU,所以不要让所有的CPU闲下来,可以适当加大线程池中的线程数目,让CPU处理更多的业务
  b)假如是业务时间长集中在计算操作上,也就是计算密集型任务,这个就没办法了,和(1)一样吧,线程池中的线程数设置得少一些,减少线程上下文的切换
(3)并发高、业务执行时间长,解决这种类型任务的关键不在于线程池而在于整体架构的设计,看看这些业务里面某些数据是否能做缓存是第一步,增加服务器是 第二步,至于线程池的设置,设置参考

线程池状态

状态控制器

//线程池状态控制器,用于保证线程池状态和工作线程数 ps:低29位为工作线程数量,高3位为线程池状态
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
//设定偏移量 Integer.SIZE = 32 -> 即COUNT_BITS = 29
private static final int COUNT_BITS = Integer.SIZE - 3;
//确定最大的容量2^29-1
private static final int CAPACITY   = (1 << COUNT_BITS) - 1;
//获取线程池状态,取高3位
private static int runStateOf(int c)     { return c & ~CAPACITY; }
//获取工作线程数量,取低29位
private static int workerCountOf(int c)  { return c & CAPACITY; }
/** 
 * 获取线程池状态控制器
 * @param rs 表示runState 线程池状态
 * @param wc 表示workerCount 工作线程数量
 */
private static int ctlOf(int rs, int wc) { return rs | wc; }

&:与运算符,同位都为1才为1,否则为0

|:或运算符,同位有一个为1即为1,否则为0

~:非运算符,0和1互换,即若是0变成1,1则变成0

^:异或运算符,同位相同则为0,不同则为1

线程池状态

线程状态的流转遵循如下顺序,即由小到大顺序排列:
RUNNING -> SHUTDOWN -> STOP -> TIDYING -> TERMINATED

// runState is stored in the high-order bits 用Integer的高三位表示
//高3位111,低29位为0 该状态下线程池会接收新提交任务和执行队列任务
private static final int RUNNING    = -1 << COUNT_BITS;
//高3位000,低29位为0 该状态下线程池不再接收新任务,但还会继续执行队列任务
private static final int SHUTDOWN   =  0 << COUNT_BITS;
//高3位001,低29位为0 该状态下线程池不再接收新任务,不会再执行队列任务,并会中断正在执行中的任务
private static final int STOP       =  1 << COUNT_BITS;
//高3位010,低29位为0 该状态下线程池的所有任务都被终止,工作线程数为0,期间会调用钩子方法terminated()
private static final int TIDYING    =  2 << COUNT_BITS;
//高3位011,低29位为0 该状态下表明线程池terminated()方法已经调用完成
private static final int TERMINATED =  3 << COUNT_BITS;

Worker

Worker是线程池的内部类,用于封装工作线程和任务并管理工作线程的中断状态等功能

组成

Worker类封装了 ( 锁 + 线程 + 任务 ) 这三个部分,从而成为了一个多面手的存在:

1.继承AQS类: 实现简单的不可重入互斥锁,以提供便捷的锁操作,目的用于处理中断情况

2.实现Runnable接口: "投机取巧"的设计,主要是借用Runnable接口的统一写法,好处是不用重新写一个同功能接口

3.工作线程: Worker会通过thread变量绑定一个真正执行任务的工作线程(一对一),初始化时就由线程工厂分配好,它会反复地获取和执行任务

4.任务: Worker每次都会将新任务赋值给firstTask变量,工作线程每次通过该变量处理新获取到的任务(初始化时该值允许为null,有特殊作用)

可以简单的理解工作线程等价于worker,尤其是谈及数量时,比如创建工作线程实际上就是创建一个worker

private final class Worker
        extends AbstractQueuedSynchronizer
        implements Runnable{
    /** 实际上真正的工作线程 - 幕后大佬,但可能因线程工厂创建失败而为null */
    final Thread thread;
    /** 待执行任务,可能为null */
    Runnable firstTask;
    /** 该工作线程已完成的任务数 -- 论KPI的重要性 */
    volatile long completedTasks;        
    Worker(Runnable firstTask) {
        //设置锁状态为-1,目的是为了阻止在runWorker()之前被中断
        setState(-1); 
        /**
         * 新任务,任务来源有两个:
         *   1.调用addWorker()方法新建线程时传入的第一个任务
         *   2.调用runWorker()方法时内部循环调用getTask() -- 这就是线程复用的具现
         */
        this.firstTask = firstTask;
        /**
         * 创建一个新的线程 -> 这个是真正的工作线程
         * 注意Worker本身就是个Runnable对象
         * 因此newThread(this)中的this也是个Runnable对象
         */
        this.thread = getThreadFactory().newThread(this);
    }
}

执行任务

@FunctionalInterface
public interface Runnable {
    public abstract void run();
}
/**
 * 工作线程运行
 * runWorker方法内部会通过轮询的方式
 * 不停地获取任务和执行任务直到线程被回收
 */
public void run() {
    runWorker(this);
}

(重点)这里简单介绍一下线程在线程池执行任务的工作流程:
1.工作线程开始执行前,需先对worker加锁,任务完成解锁

2.任务执行前后分别执行beforeExecute()和afterExecute()方法

3.执行中遇到异常会向外抛出,线程是否死亡取决于您对于异常的处理

4.每个任务执行完后,当前工作线程任务完成数自增,同时会循环调用getTask()从任务队列中反复获取任务并执行,无任务可执行时线程会阻塞在该方法上

5.当工作线程因各种理由退出时,会执行processWorkerExit()回收线程(核心是将该worker从workers集合中移除,注意之前worker已经退出任务循环,因此已经不再做工了,从集合移除后就方便gc了)

锁方法

// Lock methods
// The value 0 represents the unlocked state. 0表示未锁定
// The value 1 represents the locked state. 1表示已锁定
protected boolean isHeldExclusively() {
    return getState() != 0;
}
protected boolean tryAcquire(int unused) {
    //锁状态非0即1,即不可重入
    //特殊情况:只有初始化时才为-1,目的是防止线程初始化阶段被中断
    if (compareAndSetState(0, 1)) {
        //当前线程占有锁
        setExclusiveOwnerThread(Thread.currentThread());
        return true;
    }
    return false;
}
protected boolean tryRelease(int unused) {
    //释放锁
    setExclusiveOwnerThread(null);
    //状态恢复成未锁定状态
    setState(0);
    return true;
}
public void lock()        { acquire(1); }
public boolean tryLock()  { return tryAcquire(1); }
public void unlock()      { release(1); }
public boolean isLocked() { return isHeldExclusively(); }
void interruptIfStarted() {
    Thread t;
    if (getState() >= 0 && (t = thread) != null 
                && !t.isInterrupted()){
        try {
            t.interrupt();
        } catch (SecurityException ignore) {
        }
    }
}

小问:为什么不直接执行提交的command而必须使用Worker封装?
友情小提示:这跟worker的作用有关系

小答:主要是为了控制中断

小问:如何控制中断?
友情小提示:Worker继承了AQS从而是一把AQS锁

小答:Worker对于中断处理有如下四个准则:
1.当工作线程真正开始执行之前,不允许被中断

2.当工作线程正在执行任务时,不允许被中断

3.当工作线程正等待从任务队列中获取任务getTask()时才能被中断

4.调用interruptIdleWorkers()中断空闲线程时必须先获得worker锁

小问:为什么Worker不被设计成可重入锁?
友情小提示:禁止在动态控制时再次获取锁

小答:由于在动态控制方法中可能会中断线程,比如调用interruptIdleWorkers(),由此该方法在执行interrupt()之前会调用worker.tryLock(),若此时允许重入,就会导致线程被意外中断,这跟当工作线程正在执行任务时,不允许被中断准则是相违背的

动态控制

线程池提供了几个公共方法用于动态控制线程池的配置信息:

/**
 * 设置核心工作线程数
 * 1.若新值<当前值时,将调用interruptIdleWorkers()处理超出部分线程
 * 2.若新值>当前值时,新创建的线程(若有必要)直接会处理队列中的任务
 */
public void setCorePoolSize(int corePoolSize)
/**
 * 设置是否响应核心工作线程超时处理
 * 1.设置false时,核心工作线程不会因为任务数不足(空闲)而被终止
 * 2.设置true时,核心工作线程和非核心工作线程待遇一样,会因为超时而终止
 * 注意:为了禁止出现持续性的线程替换,当设置true时,超时时间必须>0
 * 注意:该方法通常应在线程池被使用之前调用
 */
public void allowCoreThreadTimeOut(boolean value)
/**
 * 设置最大工作线程数
 * 1.若新值<当前值时,将调用interruptIdleWorkers()处理超出部分线程
 * 注意:当新值>当前值时是无需做任何处理的,跟设置核心工作线程数不一样
 */
public void setMaximumPoolSize(int maximumPoolSize)
/** 
 * 设置超时时间,超时后工作线程将被终止
 * 注意:若实际工作线程数只剩一个,除非线程池被终止,否则无须响应超时
 */
public void setKeepAliveTime(long time, TimeUnit unit) 

任务提交与执行

execute() - 提交任务

/**
 * 在未来的某个时刻执行给定的任务
 * 这个任务由一个新线程执行,或者用一个线程池中已经存在的线程执行
 * 如果任务无法被提交执行,要么是因为这个Executor已经被shutdown关闭
 * 要么是已经达到其容量上限,任务会被当前的RejectedExecutionHandler处理
 */
public void execute(Runnable command) {
        //新任务不允许为空,空则抛出NPE
        if (command == null)
            throw new NullPointerException();
        /**
         * 1.若实际工作线程数 < 核心工作线程数,会尝试创建一个工作线程去执行该
         * 任务,即该command会作为该线程的第一个任务,即第一个firstTask
         * 
         * 2.若任务入队成功,仍需要执行双重校验,原因有两点:
         *      - 第一个是去确认是否需要新建一个工作线程,因为可能存在
         *        在上次检查后已经死亡died的工作线程
         *      - 第二个是可能在进入该方法后线程池被关闭了,
         *        比如执行shutdown()
         *   因此需要再次检查state状态,并分别处理以上两种情况:
         *      - 若线程池中已无可用工作线程了,则需要新建一个工作线程 
         *      - 若线程池已被关闭,则需要回滚入队列(若有必要)
         * 
         * 3.若任务入队失败(比如队列已满),则需要新建一个工作线程; 
         *   若新建线程失败,说明线程池已停止或者已饱和,必须执行拒绝策略
         */
        int c = ctl.get();
        /**
         * 情况一:当实际工作线程数 < 核心工作线程数时
         * 执行方案:会创建一个新的工作线程去执行该任务
         * 注意:此时即使有其他空闲的工作线程也还是会新增工作线程,
         *      直到达到核心工作线程数为止
         */
        if (workerCountOf(c) < corePoolSize) {
            /**
             * 新增工作线程,true表示要对比的是核心工作线程数
             * 一旦新增成功就开始执行当前任务
             * 期间也会通过自旋获取队列任务进行执行
             */
            if (addWorker(command, true))
                return;
            /**
             * 需要重新获取控制器状态,说明新增线程失败
             * 线程失败的原因可能有两种:
             *  - 1.线程池已被关闭,非RUNNING状态的线程池是不允许接收新任务的
             *  - 2.并发时,假如都通过了workerCountOf(c) < corePoolSize校验,但其他线程
             *      可能会在addWorker先创建出线程,导致workerCountOf(c) >= corePoolSize,
             *      即实际工作线程数 >= 核心工作线程数,此时需要进入情况二
             */
            c = ctl.get();
        }
        /**
         * 情况二:当实际工作线程数>=核心线程数时,新提交任务需要入队
         * 执行方案:一旦入队成功,仍需要处理线程池状态突变和工作线程死亡的情况
         */
        if (isRunning(c) && workQueue.offer(command)) {
            //双重校验
            int recheck = ctl.get();
            /**
             * recheck的目的是为了防止线程池状态的突变 - 即被关闭
             * 一旦线程池非RUNNING状态时,除了从队列中移除该任务(回滚)外
             * 还需要执行任务拒绝策略处理新提交的任务
             */
            if (!isRunning(recheck) && remove(command))
                //执行任务拒绝策略
                reject(command);
            /**
             * 若线程池还是RUNNING状态 或 队列移除失败(可能正好被一个工作线程拿到处理了)
             * 此时需要确保至少有一个工作线程还可以干活
             * 补充一句:之所有无须与核心工作线程数或最大线程数相比,而只是比较0的原因是
             *          只要保证有一个工作线程可以干活就行,它会自动去获取任务
             */
            else if (workerCountOf(recheck) == 0)
                /**
                 * 若工作线程都已死亡,需要新增一个工作线程去干活
                 * 死亡原因可能是线程超时或者异常等等复杂情况
                 *
                 * 第一个参数为null指的是传入一个空任务,
                 * 目的是创建一个新工作线程去处理队列中的剩余任务
                 * 第二个参数为false目的是提示可以扩容到最大工作线程数
                 */
                addWorker(null, false);
        }
        /**
         * 情况三:一旦线程池被关闭 或者 新任务入队失败(队列已满)
         * 执行方案:会尝试创建一个新的工作线程,并允许扩容到最大工作线程数
         * 注意:一旦创建失败,比如超过最大工作线程数,需要执行任务拒绝策略
         */
        else if (!addWorker(command, false))
            //执行任务拒绝策略
            reject(command);
    }

addWorker() - 新增工作线程

/**
 * 新增工作线程需要遵守线程池控制状态规定和边界限制
 *
 * @param core core为true时允许扩容到核心工作线程数,否则为最大工作线程数
 * @return 新增成功返回true,失败返回false
 */
private boolean addWorker(Runnable firstTask, boolean core) {
    //重试标签
    retry:
    /***
     * 外部自旋 -> 目的是确认是否能够新增工作线程
     * 允许新增线程的条件有两个:
     *   1.满足线程池状态条件 -> 条件一
     *   2.实际工作线程满足数量边界条件 -> 条件二
     * 不满足条件时会直接返回false,表示新增工作线程失败
     */
    for (;;) {
        //读取原子控制量 - 包含workerCount(实际工作线程数)和runState(线程池状态)
        int c = ctl.get();
        //读取线程池状态
        int rs = runStateOf(c);
        /**
         * 条件一.判断是否满足线程池状态条件
         *  1.只有两种情况允许新增线程:
         *    1.1 线程池状态==RUNNING
         *    1.2 线程池状态==SHUTDOWN且firstTask为null同时队列非空
         *
         *  2.线程池状态>=SHUTDOWN时不允许接收新任务,具体如下:
         *    2.1 线程池状态>SHUTDOWN,即为STOP、TIDYING、TERMINATED
         *    2.2 线程池状态==SHUTDOWN,但firstTask非空
         *    2.3 线程池状态==SHUTDOWN且firstTask为空,但队列为空
         *  补充:针对1.2、2.2、2.3的情况具体请参加后面的"小问答"环节
         */
        if (rs >= SHUTDOWN &&
            !(rs == SHUTDOWN && firstTask == null && ! workQueue.isEmpty()))
            return false;
        /***
         * 内部自旋 -> 条件二.判断实际工作线程数是否满足数量边界条件
         *   -数量边界条件满足会对尝试workerCount实现CAS自增,否则新增失败
         *   -当CAS失败时会再次重新判断是否满足新增条件:
         *       1.若此期间线程池状态突变(被关闭),重新判断线程池状态条件和数量边界条件
        *        2.若此期间线程池状态一致,则只需重新判断数量边界条件
        */
        for (;;) {
            //读取实际工作线程数
            int wc = workerCountOf(c);
            /**
             * 新增工作线程会因两种实际工作线程数超标情况而失败:
             *  1.实际工作线程数 >= 最大容量
             *  2.实际工作线程数 > 工作线程比较边界数(当前最大扩容数)
             *   -若core = true,比较边界数 = 核心工作线程数
             *   -若core = false,比较边界数 = 最大工作线程数
             */
            if (wc >= CAPACITY || wc >= (core ? corePoolSize : maximumPoolSize))
                return false;
            /**
             * 实际工作线程计数CAS自增:
             *   1.一旦成功直接退出整个retry循环,表明新增条件都满足
             *   2.因并发竞争导致CAS更新失败的原因有三种: 
             *      2.1 线程池刚好已新增一个工作线程
             *        -> 计数增加,只需重新判断数量边界条件
             *      2.2 刚好其他工作线程运行期发生错误或因超时被回收
             *        -> 计数减少,只需重新判断数量边界条件
             *      2.3 刚好线程池被关闭 
             *        -> 计数减少,工作线程被回收,
             *           需重新判断线程池状态条件和数量边界条件
             */
            if (compareAndIncrementWorkerCount(c))
                break retry;
            //重新读取原子控制量 -> 原因是在此期间可能线程池被关闭了
            c = ctl.get();
            /**
             * 快速检测是否发生线程池状态突变
             *  1.若状态突变,重新判断线程池状态条件和数量边界条件
             *  2.若状态一致,则只需重新判断数量边界条件
             */
            if (runStateOf(c) != rs)
                continue retry;
        }
    }
    /**
     * 这里是addWorker方法的一个分割线
     * 前面的代码的作用是决定了线程池接受还是拒绝新增工作线程
     * 后面的代码的作用是真正开始新增工作线程并封装成Worker接着执行后续操作
     * PS:虽然笔者觉得这个方法其实可以拆分成两个方法的(在break retry的位置)
     */
    //记录新增的工作线程是否开始工作
    boolean workerStarted = false;
    //记录新增的worker是否成功添加到workers集合中
    boolean workerAdded = false;
    Worker w = null;
    try {
        //将新提交的任务和当前线程封装成一个Worker
        w = new Worker(firstTask);
        //获取新创建的实际工作线程
        final Thread t = w.thread;
        /**
         * 检测是否有可执行任务的线程,即是否成功创建了新的工作线程
         *   1.若存在,则选择执行任务
         *   2.若不存在,则需要执行addWorkerFailed()方法
         */
        if (t != null) {
            /**
             * 新增工作线程需要加全局锁
             * 目的是为了确保安全更新workers集合和largestPoolSize
             */
            final ReentrantLock mainLock = this.mainLock;
            mainLock.lock();
            try {
                /**
                 * 获得全局锁后,需再次检测当前线程池状态
                 * 原因在于预防两种非法情况:
                 *  1.线程工厂创建线程失败
                 *  2.在锁被获取之前,线程池就被关闭了
                 */
                int rs = runStateOf(ctl.get());
                /**
                 * 只有两种情况是允许添加work进入works集合的
                 * 也只有进入workers集合后才是真正的工作线程,并开始执行任务
                 *  1.线程池状态为RUNNING(即rs<SHUTDOWN)
                 *  2.线程池状态为SHUTDOWN且传入一个空任务
                 *  (理由参见:小问答之快速检测线程池状态?) 
                 */
                if (rs < SHUTDOWN ||
                    (rs == SHUTDOWN && firstTask == null)) {
                    /**
                     * 若线程处于活动状态时,说明线程已启动,需要立即抛出"线程状态非法异常"
                     * 原因是线程是在后面才被start的,已被start的不允许再被添加到workers集合中
                     * 换句话说该方法新增线程时,而线程是新的,本身应该是初始状态(new)
                     * 可能出现的场景:自定义线程工厂newThread有可能会提前启动线程
                     */
                    if (t.isAlive())
                        throw new IllegalThreadStateException();
                    //由于加锁,所以可以放心的加入集合
                    workers.add(w);
                    int s = workers.size();
                    //更新最大工作线程数,由于持有锁,所以无需CAS
                    if (s > largestPoolSize)
                        largestPoolSize = s;
                    //确认新建的worker已被添加到workers集合中  
                    workerAdded = true;
                }
            } finally {
                //千万不要忘记主动解锁
                mainLock.unlock();
            }
            /**
             * 一旦新建工作线程被加入工作线程集合中,就意味着其可以开始干活了
             * 有心的您肯定发现在线程start之前已经释放锁了
             * 原因在于一旦workerAdded为true时,说明锁的目的已经达到
             * 根据最小化锁作用域的原则,线程执行任务无须加锁,这是种优化
             * 也希望您在使用锁时尽量保证锁的作用域最小化
             */
            if (workerAdded) {
                /**
                 * 启动线程,开始干活啦
                 * 若您看过笔者的"并发番@Thread一文通"肯定知道start()后,
                 * 一旦线程初始化完成便会立即调用run()方法
                 */
                t.start();
                //确认该工作线程开始干活了
                workerStarted = true;
            }
        }
    } finally {
        //若新建工作线程失败或新建工作线程后没有成功执行,需要做新增失败处理
        if (!workerStarted)
            addWorkerFailed(w);
    }
    //返回结果表明新建的工作线程是否已启动执行
    return workerStarted;
}

小问:快速检测线程状态时,情况1.2、2.1、2.3的意义是什么?
友情小提示:读者可以反问自己 -> 何时新增Worker才是有意义的呢?传入一个空任务的目的是什么?

小答:在阐明这个问题之前,我们先明确两个知识点:
1.新增Worker的目的是处理任务,任务来源分初始任务和队列任务(即剩余的待处理任务)

2.线程池在非RUNNING状态下是不允许接收新任务的,换句话说您都要下班了,难道还想接新需求?

针对2.1 - > 线程池状态==SHUTDOWN,但firstTask!= null,不允许新增Worker
当线程池状态为SHUTDOWN时,由于不允许接收新任务,因此一旦firstTask!= null需要直接拒绝
针对2.2 - > 线程池状态==SHUTDOWN且firstTask == null,但队列为空,不允许新增Worker
当firstTask为null时,说明调用addWorker()目的不是为了处理新增任务
那么其目的应该是为了处理剩余任务,即队列中的任务,而一旦队列为空,那也没必要新增Worker了
针对1.2 - > 若线程池状态==SHUTDOWN,必须满足firstTask为null且队列非空,才允许新增Worker
当线程池状态为SHUTDOWN时(调用shutdown()),此时不允许接收新任务,因此firstTask必须为null
但需要处理剩余任务,因此队列必须非空,否则新增的工作线程就无任务可做,那就没意义了
结论:传入一个空任务的目的是为了新增工作线程去处理任务队列中的剩余任务

小问:线程是如何真正开始工作的,即何时开始执行runWorker()?
友情小提示:结合Thread和Worker的构造器考虑一下

private final class Worker
        extends AbstractQueuedSynchronizer
        //步骤1:实现Runnable接口,从而自身是个Runnable,可以调用run方法
        implements Runnable{ 
    Worker(Runnable firstTask) {
        setState(-1); 
        this.firstTask = firstTask;
        //步骤2:newThread()的参数传入的是this,即Worker本身,注意Worker是Runnable
        this.thread = getThreadFactory().newThread(this);    
    }    
    /**
     * 步骤3:调用run()最终执行runWorker()
     * - 在addWorker()中会使用 worker.thread.start()启动线程
     * - thread启动后会立即调用run()方法,这就意味着启动调用会经历这样的过程:
     *   worker = new Worker(Runnable) - > thread = newThread(worker) -> thread.start() -> 
     *   thread.run()[JVM自动调用] -> worker.run() -> threadPoolExecuter.runWorker(worker)
     */
    public void run() {
        runWorker(this);
    }
}

结论之启动调用会经历一下过程:
(1) worker = new Worker(Runnable) --> (2) thread = newThread(worker) --> (3) thread.start() --> (4) thread.run()[JVM自动调用] --> (5) worker.run() --> (6) threadPoolExecuter.runWorker(worker)

runWorker() - 执行任务

final void runWorker(Worker w) {
    //读取当前线程 -即调用execute()方法的线程(一般是主线程)
    Thread wt = Thread.currentThread();
    //读取待执行任务
    Runnable task = w.firstTask;
    //清空任务 -> 目的是用来接收下一个任务
    w.firstTask = null;
    /**
     * 注意Worker本身也是一把不可重入的互斥锁!
     * 由于Worker初始化时state=-1,因此此处的解锁的目的是:
     * 将state-1变成0,因为只有state>=0时才允许中断;
     * 同时也侧面说明在worker调用runWorker()之前是不允许被中断的,
     * 即运行前不允许被中断
     */
    w.unlock();
    //记录是否因异常/错误突然完成,默认有异常/错误发生
    boolean completedAbruptly = true;
    try {
        /**
         * 获取任务并执行任务,取任务分两种情况:
         *   1.初始任务:Worker被初始化时赋予的第一个任务(firstTask)
         *   2.队列任务:当firstTask任务执行好后,线程不会被回收,而是之后自动自旋从任务队列中取任务(getTask)
         *     此时即体现了线程的复用
         */
        while (task != null || (task = getTask()) != null) {
            /**
             * Worker加锁的目的是为了在shutdown()时不要立即终止正在运行的worker,
             * 因为需要先持有锁才能终止,而不是为了处理并发情况(注意不是全局锁)
             * 在shutdownNow()时会立即终止worker,因为其无须持有锁就能终止
             * 关于关闭线程池下文会再具体详述
             */
            w.lock();
            /**
             * 当线程池被关闭且主线程非中断状态时,需要重新中断它
             * 由于调用线程一般是主线程,因此这里是主线程代指调用线程
             */
            if ((runStateAtLeast(ctl.get(), STOP) ||
                 (Thread.interrupted() &&
                    runStateAtLeast(ctl.get(), STOP))) &&
                        !wt.isInterrupted())
                wt.interrupt();
            try {
                /**
                 * 每个任务执行前都会调用"前置方法",
                 * 在"前置方法"可能会抛出异常,
                 * 结果是退出循环且completedAbruptly=true,
                 * 从而线程死亡,任务未执行(并被丢弃)
                 */
                beforeExecute(wt, task);
                Throwable thrown = null;
                try {
                    //执行任务
                    task.run();
                } catch (RuntimeException x) {
                    thrown = x; throw x;
                } catch (Error x) {
                    thrown = x; throw x;
                } catch (Throwable x) {
                    thrown = x; throw new Error(x);
                } finally {
                    /**
                     * 任务执行结束后,会调用"后置方法"
                     * 该方法也可能抛异常从而导致线程死亡
                     * 但值得注意的是任务已经执行完毕
                     */
                    afterExecute(task, thrown);
                }
            } finally {
                //清空任务 help gc
                task = null;
                //无论成功失败任务数都要+1,由于持有锁所以无须CAS
                w.completedTasks++;
                //必须要主动释放锁
                w.unlock();
            }
        }
        //无异常时需要清除异常状态
        completedAbruptly = false;
    } finally {
        /**
         * 工作线程退出循环的原因有两个:
         *  1.因意外的错误/异常退出
         *  2.getTask()返回空 -> 原因有四种,下文会详述
         * 工作线程退出循环后,需要执行相对应的回收处理
         */
        processWorkerExit(w, completedAbruptly);
    }
}

小问:为什么新任务不直接放入任务队列而是被新线程执行呢?
小提示:主要是为了减少不必要的开销,从而提供性能

小答:新任务不直接放入任务队列目的是减少任务队列的入队和出队操作,因为任务队列本身是阻塞队列,因此其入队和出队操作会涉及锁操作以及并发处理

getTask() - 获取任务

造成getTask()方法返回null的原因有5种:
1.线程池被关闭,状态为(STOP || TIDYING || TERMINATED)

2.线程池被关闭,状态为SHUTDOWN且任务队列为空

3.实际工作线程数超过最大工作线程数

4.工作线程满足超时条件后,同时符合下述的任意一种情况:
4.1 线程池中还存在至少一个其他可用的工作线程

4.2 线程池中已没有其他可用的工作线程但任务队列为空

private Runnable getTask() {
    // 记录任务队列的poll()是否超时,默认未超时
    boolean timedOut = false; 
    //自旋获取任务
    for (;;) {
        /**
         * 线程池会依次判断五种情况,满足任意一种就返回null:
         *    1.线程池被关闭,状态为(STOP || TIDYING || TERMINATED)
         *    2.线程池被关闭,状态为SHUTDOWN且任务队列为空
         *    3.实际工作线程数超过最大工作线程数
         *    4.工作线程满足超时条件后,同时符合下述的任意一种情况:
         *      4.1 线程池中还存在至少一个其他可用的工作线程
         *      4.2 线程池中已没有其他可用的工作线程但任务队列为空
         */
        int c = ctl.get();
        int rs = runStateOf(c);
        /**
         * 判断线程池状态条件,有两种情况直接返回null
         *  1.线程池状态大于SHUTDOWN(STOP||TIDYING||TERMINATED),说明不允许再执行任务
         *    - 因为>=STOP以上状态时不允许接收新任务同时会中断正在执行中的任务,任务队列的任务也不执行了         
         *  
         *  2.线程池状态为SHUTDOWN且任务队列为空,说明已经无任务可执行
         *    - 因为SHUTDOWN时还需要执行任务队列的剩余任务,只有当无任务才可退出
         */
        if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
            /**
             * 减少一个工作线程数
             * 值得注意的是工作线程的回收是放在processWorkerExit()中进行的
             * decrementWorkerCount()方法是内部不断循环执行CAS的,保证最终一定会成功
             * 补充:因线程池被关闭而计数减少可能与addWorker()的
             *      计数CAS自增发生并发竞争
             */
            decrementWorkerCount();
            return null;
        }
        //读取实际工作线程数
        int wc = workerCountOf(c);
        /**
         * 判断是否需要处理超时:
         *   1.allowCoreThreadTimeOut = true 表示需要回收空闲超时的核心工作线程
         *   2.wc > corePoolSize 表示存在空闲超时的非核心工作线程需要回收
         */
        boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
         /**
          * 有三种情况会实际工作线程计数-1且直接返回null
          *
          *    1.实际工作线程数超过最大线程数
          *    2.该工作线程满足空闲超时条件需要被回收:
          *       2.1 当线程池中还存在至少一个其他可用的工作线程
          *       2.2 线程池中已没有其他可用的工作线程但任务队列为空
          *  
          * 结合2.1和2.2我们可以推导出:
          *
          *   1.当任务队列非空时,线程池至少需要维护一个可用的工作线程,
          *     因此此时即使该工作线程超时也不会被回收掉而是继续获取任务
          *
          *   2.当实际工作线程数超标或获取任务超时时,线程池会因为
          *     一直没有新任务可执行,而逐渐减少线程直到核心线程数为止;
          *     若设置allowCoreThreadTimeOut为true,则减少到1为止;
          *
          * 提示:由于wc > maximumPoolSize时必定wc > 1,因此无须比较
          * (wc > maximumPoolSize && workQueue.isEmpty()) 这种情况
          */
        if ((wc > maximumPoolSize || (timed && timedOut))
            && (wc > 1 || workQueue.isEmpty())) {
            /**
             * CAS失败的原因还是出现并发竞争,具体参考上文
             * 当CAS失败后,说明实际工作线程数已经发生变化,
             * 必须重新判断实际工作线程数和超时情况
             * 因此需要countinue
             */
            if (compareAndDecrementWorkerCount(c))
                return null;
           /**        
            */                
            continue;
        }
        //若满足获取任务条件,根据是否需要超时获取会调用不同方法
        try {
           /**
            * 从任务队列中取任务分两种:
            *  1.timed=true 表明需要处理超时情况
            *   -> 调用poll(),超过keepAliveTime返回null
            *  2.timed=fasle 表明无须处理超时情况
            *   -> 调用take(),无任务则挂起等待
            */
            Runnable r = timed ?
                workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                workQueue.take();
            //一旦获取到任务就返回该任务并退出循环
            if (r != null)
                return r;
            //当任务为空时说明poll超时
            timedOut = true;
            /**
             * 关于中断异常获取简单讲一些超出本章范畴的内容
             * take()和poll(long timeout, TimeUnit unit)都会throws InterruptedException
             * 原因在LockSupport.park(this)不会抛出异常但会响应中断;
             * 但ConditionObject的await()会通过reportInterruptAfterWait()响应中断
             * 具体内容笔者会在阻塞队列相关番中进一步介绍
             */
        } catch (InterruptedException retry) {
            /**
             * 一旦该工作线程被中断,需要清除超时标记
             * 这表明当工作线程在获取队列任务时被中断,
             * 若您不对中断异常做任务处理,线程池就默认
             * 您希望线程继续执行,这样就会重置之前的超时标记
             */
            timedOut = false;
        }
    }
}

小问:为什么当任务为空时说明poll超时?
友情小提示:可以联想一下阻塞队列操作接口


225554_IqGM_2246410.png

关闭线程池

关闭线程池主要有两种方式,两者的区别是:
shutdown() : 队列剩余任务全部执行完毕再终止

shutdownNow() : 放弃执行队列剩余任务,但会将它们返回

两者的共性在于:
1.正在执行中的任务会继续执行,不会被终止或放弃

2.新提交的任务会被直接拒绝

shutdown() - 有序关闭

使用shutdown()关闭线程池最主要执行5个操作:
1.获取全局锁

2.CAS自旋变更线程池状态为SHUTDOWN

3.中断所有空闲工作线程(设置中断标记) -> 注意是空闲

4.释放全局锁

5.尝试终止线程池

/**
 * 有序关闭线程池
 * 在关闭过程中,之前已提交的任务将被执行(包括正在和队列中的),
 * 但新提交的任务会被拒绝
 * 如果线程池已经被关闭,调用该方法不会有任何附加效果
 */
public void shutdown() {
    //1.获取全局锁
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        checkShutdownAccess();
        //2.CAS自旋变更线程池状态为SHUTDOWN
        advanceRunState(SHUTDOWN);
        //3.中断所有空闲工作线程
        interruptIdleWorkers();
        //专门提供给ScheduledThreadPoolExecutor的钩子方法
        onShutdown();
    } finally {
        //4.释放全局锁
        mainLock.unlock();
    }
    /**
     * 5.尝试终止线程池,此时线程池满足两个条件:
     *   1.线程池状态为SHUTDOWN
     *   2.所有空闲工作线程已被中断
     */
    tryTerminate();
}

shutdownNow() - 立即关闭

使用shutdownNow()关闭线程池最主要执行六个操作:
1.获取全局锁

2.CAS自旋变更线程池状态为SHUTDOWN

3.中断所有工作线程(设置中断标记)

4.将剩余任务重新放入一个list中并清空任务队列

5.释放全局锁

6.尝试终止线程池

/**
 * 尝试中断所有工作线程,并返回待处理任务列表集合(从任务队列中移除)
 *
 * 1.若想等待执行中的线程完成任务,可使用awaitTermination()
 * 2.由于取消任务操作是通过Thread#interrupt实现,因此
 *   响应中断失败的任务可能永远都不会被终止(谨慎使用!!!)
 *   响应中断失败指的是您选择捕获但不处理该中断异常
 */
public List<Runnable> shutdownNow() {
    List<Runnable> tasks;
    //1.获取全局锁
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        checkShutdownAccess();
        //2.CAS自旋更新线程池状态为STOP
        advanceRunState(STOP);
        //3.中断所有工作线程
        interruptWorkers();
        //4.将剩余任务重新放入一个list中并清空任务队列
        tasks = drainQueue();
    } finally {
        //5.释放全局锁
        mainLock.unlock();
    }
    /**
     * 6.尝试终止线程池,此时线程池满足两个条件:
     *   1.线程池状态为STOP
     *   2.任务队列为空
     * 注意:此时不一定所有工作线程都被中断回收,详述见
     *       7.3 tryTerminate
     */
    tryTerminate();
    //5.返回待处理任务列表集合
    return tasks;
}

awaitTermination() - 等待线程池终止

当关闭线程池时,awaitTermination()会一直阻塞直到下述任一种情况的出现:
1.所有任务执行完毕: 线程池只有在调用tryTerminated()尝试终止线程池并成功将状态变更为TERMINATED后才会调用termination.signalAll(),此后阻塞线程被唤醒后会再次判断状态,一旦满足TERMINATED就会退出

2.到达阻塞超时时间: termination.awaitNanos()在到达超时间后便会返回剩余时间(此时为0),随后会因再次判断满足nano==0导致return false,即等待失败

3.当前线程被中断: 若当前线程(主线程)被中断,线程会抛出InterruptException中断异常,若不做异常处理就会因异常而解除阻塞

public boolean awaitTermination(long timeout, TimeUnit unit)
        throws InterruptedException {
    long nanos = unit.toNanos(timeout);
    final ReentrantLock mainLock = this.mainLock;
    //1.获取全局锁
    mainLock.lock();
    try {
        for (;;) {
            //2.所有任务执行完毕,等待成功而退出
            if (runStateAtLeast(ctl.get(), TERMINATED))
                return true;
            //3.到达阻塞超时时间,等待失败而退出
            if (nanos <= 0)
                return false;
            nanos = termination.awaitNanos(nanos);
        }
    } finally {
        //4.释放全局锁
        mainLock.unlock();
    }
}

您可以通过以下方式得知线程池是否真正被关闭:

//关闭线程池
threadPoolExecutor.shutdown();
try{
    //循环调用等待任务最终全部完成
    while(!threadPoolExecutor.awaitTermination(300, TimeUnit.MILLISECONDS)) {
        logger.info("task executing...");
    }
    //此时剩余任务全部执行完毕,开始执行终止流程
    logger.info("shutdown completed!")
} catch (InterruptedException e) {
    //中断处理
}

中断和终止处理

interruptIdleWorkers() - 中断空闲线程

Worker对于中断处理有如下四个准则(前面的知识我们再回顾一遍):
1.当工作线程真正开始执行之前,不允许被中断

2.当工作线程正在执行任务时,不允许被中断

3.当工作线程正等待从任务队列中获取任务getTask()时才能被中断

4.调用interruptIdleWorkers()中断空闲线程时必须先获得worker锁

/**
 * 中断全部空闲线程
 */
private void interruptIdleWorkers() {
    interruptIdleWorkers(false);
}
/**
 * 中断未上锁且在等待任务的空闲线程
 * 中断的作用在于便于处理终止线程池或动态控制的情况
 *
 * @param onlyOne 为true时为中断一个,为false时为中断全部
 */
private void interruptIdleWorkers(boolean onlyOne) {
    //加全局锁
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        /**
         * 循环方式中断工作线程
         * 这里也体现了workers集合的核心作用之一
         */
        for (Worker w : workers) {
            Thread t = w.thread;
            /**
             * 非中断且成功获取到worker锁的工作线程才允许被中断
             * 
             *  1.已被中断的工作线程无须再次标记中断
             *
             *  2.w.tryLock()体现了Worker作为一把锁的核心作用:
             *  即控制线程中断 -> 当线程还在运行中是不允许被中断的
             * 
             *  3.具体可以参见runWorker()方法,运行前都是调用lock()
             * 
             *  4.由于该方法只会在shutdown()中调用,间接也说明
             *  shutdown()只会中断在该方法中获取到worker锁
             *  的空闲线程(此时线程正在获取新任务getTask(),还没上锁)
             */
            if (!t.isInterrupted() && w.tryLock()) {
                try {
                    //中断工作线程
                    t.interrupt();
                } catch (SecurityException ignore) {
                } finally {
                    //注意这里释放的是worker锁,对应tryLock()
                    w.unlock();
                }
            }
            //onlyOne为true时,只随机中断一个空闲线程(Set可是无序的哦)
            if (onlyOne)
                break;
        }
    } finally {
        //释放全局锁
        mainLock.unlock();
    }
}

interruptWorkers() - 中断所有线程

/**
 * 中断所有线程,包括正在执行任务的线程
 * 该方法只提供给shutdownNow()使用
 */
private void interruptWorkers() {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        //循环设置中断标志 
        for (Worker w : workers)
            w.interruptIfStarted();
    } finally {
        mainLock.unlock();
    }
}
/**
 * Worker实现的中断方法
 */
void interruptIfStarted() {
    Thread t;
    /**
     * 当线程池非RUNNING状态 && 线程非空 && 线程非中断
     * 三者同时满足时才允许中断
     * 
     * 为什么线程池必须非RUNNING状态才允许中断呢?
     *  因为该方法只提供给interruptWorkers()使用
     *  而interruptWorkers()只提供给shutdownNow()使用
     *  因此此时线程状态应为STOP
     */
    if (getState() >= 0 && (t = thread) != null 
            && !t.isInterrupted()) {
        try {
            //设置中断标志
            t.interrupt();
        } catch (SecurityException ignore) {
        }
    }
}

tryTerminate() - 尝试终止线程池

小问:为什么正在执行任务的工作线程不允许被中断?
友情小提示:工作线程执行任务前需加worker锁且该锁非重入

小答:回顾interruptIdleWorkers()我们发现在(1)必须先调用tryLock()成功获取worker锁后才允许中断该工作线程,而因为(2)工作线程获取到任务后并在执行任务之前也会先加worker锁且worker锁是不可重入的,这就意味着正在执行任务的工作线程不允许被中断

小问:线程中断是如何影响线程回收的?
友情小提示:核心在于当getTask()返回null时会退出runWorker()并执行processWorkerExit()

造成getTask()方法返回null的原因有5种:
1.线程池被关闭,状态为(STOP || TIDYING || TERMINATED)

2.线程池被关闭,状态为SHUTDOWN且任务队列为空

3.实际工作线程数超过最大工作线程数

4.工作线程满足超时条件后,同时符合下述的任意一种情况:
4.1 线程池中还存在至少一个其他可用的工作线程

4.2 线程池中已没有其他可用的工作线程但任务队列为空

由上述可知,当线程池关闭、线程超时或动态控制线程(比如池大小数、超时时间等)都可能造成getTask()返回null,那getTask()是如何影响回收的呢?

我们仅以关闭线程池为例(其他情况也只是条件判断不同的区别),描述一下中断后会发生的逻辑:

1.当阻塞在getTask()上的工作线程被中断后会抛出InterruptedException中断异常,之后会解除阻塞重新获取任务

2.重新获取任务仍需重新校验任务获取条件,当线程池关闭时,比如调用shutdown(),线程池状态变为SHUTDOWN,又因为此时任务队列为空,getTask()直接返回null;若调用shutdownNow(),线程池状态变为STOP,则直接返回null

3.在runWorker()方法中,当getTask()返回null后,会退出循环,然后调用processWorkerExit()方法线程回收操作

小问:既然关闭线程池后线程池状态变更且被中断后的线程会被回收,为什么还要执行tryTerminate()?
小答:调用shutdown()后,正在执行任务的工作线程不会被中断,当它们结束任务后,假设队列非空,这些工作线程会继续执行剩余任务直到阻塞,随着任务数的减少,实际工作线程数会不断减少直到最小维护数量;当队列为空时,最小维护数的工作线程们会一直被阻塞在workerQueue.take()上面,永远无法终止了,且线程池被关闭后也不会再接收新提交的任务

-在任何可能导致线程池终止的地方都要调用tryTerminate(),该方法会判断线程池是否已进入终止流程,若此时还有线程存在,会重新中断一个空闲工作线程

终止流程:线程池状态为SHUTDOWN且任务队列为空,或线程池状态为STOP

/**
 * 终止线程池 -> 最终会将线程池状态变更为TERMINATED
 * 只有同时满足下面两个条件才允许做TERMINATED的状态转变:
 *    1.线程池状态为SHUTDOWN且任务队列为空 或状态为STOP
 *    2.线程池中已没有存活的工作线程 -> 实际工作线程为0
 */
final void tryTerminate() {
    //自旋
    for (;;) {
        //获取线程池控制器
        int c = ctl.get();
        /**
         * 有4种情况是不允许执行变更TERMINATED操作
         *
         *   1.线程池仍为运行态RUNNING,说明线程池还在正常运行中,
         *     此时是不允许尝试中断,起码要SHUTDOWN或STOP
         *     规则参见shutdown()和shutdownNow()
         *
         *   2.线程池状态已经是TIDYING或TERMINATED,
         *     前者说明变更TERMINATED正在执行中,后者说明终止已完成
         *     这两种情况都无须重复执行终止
         *
         *   3.线程池状态为SHUTDOWN且任务队列非空,
         *     说明线程池虽然已被要求关闭,但还有任务还没处理完
         *     需要等待任务队列中剩余任务被执行完毕
         */
        if (isRunning(c) ||
            runStateAtLeast(c, TIDYING) ||
            (runStateOf(c) == SHUTDOWN && ! workQueue.isEmpty()))
            return;
        /**
         * 此时线程池状态为SHUTDOWN状态且队列为空,或已是STOP状态
         * 4.若工作线程数非0,说明还有工作线程可能正在执行或等待任务中,
         * 这种情况的原因参见上文中的小问答之`为什么还要执行tryTerminate()`
         * 此时会选择中断一个空闲工作线程以确保SHUTDOWN信号的传播
         */
        if (workerCountOf(c) != 0) { // Eligible to terminate
            /**
             * 此时已经进入终止流程,为了传播SHUTDOWN信号,
             * 每次总是中断一个空闲工作线程以避免所有线程等待
             * 
             * 小问:此时若调用interruptIdleWorkers(false)呢?
             * 小答:注意每个线程的回收都会调用processWorkerExit()
             *       而该方法都会调用tryTerminate(),而此时一旦
             *       设置为true(表示全部)的话,由于中断操作前必须
             *       通过worker.tryLock()加锁,因此就可能因锁竞争
             *       造成不必要的大量等待,还不如一个个执行
             *
             * 小问:那么为什么shutdown()的时候可以为true呢?
             * 小答:那是因为空闲线程都是没有持有worker锁的!
             *      那么就不会出现锁竞争带来的不必要的开销
             */
            interruptIdleWorkers(ONLY_ONE);
            return;
        }
        /**
         * 当进入终止流程且无存活的工作线程时
         * 那么就可以terminate终止线程池了
         */
        //1.获取全局锁
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            /**
             * 2.先尝试变成TIDYING状态
             *   1.一旦成功,执行🐶方法terminated()
             *   2.CAS失败后会重试,失败原因可能是线程池刚好
             *     已被设置为TERMINATED,即线程池终止已经完成,
             *     之后在重新循环中会因runStateAtLeast(c, TIDYING)
             *     而退出该方法
             */
            if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {
                try {
                    //3.执行终止
                    terminated();
                } finally {
                    //4.设置TERMINATED状态
                    ctl.set(ctlOf(TERMINATED, 0));
                    /**
                     * 5.通过唤醒解除条件阻塞
                     * 当关闭线程池后需要等待剩余任务完成才真正终止线程池,
                     * 会调用awaitTermination()方法,
                     * 此时主线程会被
                     * 
                     */
                    termination.signalAll();
                }
                return;
            }
        } finally {
            //6.释放全局锁
            mainLock.unlock();
        }
        // else retry on failed CAS
    }
}

线程失败和回收处理

addWorkerFailed() - 新增线程失败处理

处理新增工作线程失败会执行如下操作:
1.获得全局锁

2.从workers集合中移除该worker

3.CAS自旋减少实际工作线程计数

4.尝试终止线程池

5.释放全局锁

/**
 * 新增工作线程失败处理
 */
private void addWorkerFailed(Worker w) {
    //1.获取全局锁 -> 目的是为了安全更新workers
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        //2.从workers集合中移除该worker
        if (w != null)
            workers.remove(w);
        /**
         * 3.CAS自旋减少实际工作线程计数 -> 最终会成功
         * 小问:为何已经加锁还是使用CAS?
         * 小答:workers必须在持有锁环境下使用,ctl无须在持有锁环境下使用
         *   1.workers集合为非线程安全的HashSet,不能使用CAS只能加锁(即外部控制方式)
         *   2.ctl为AtomicInteger原子类型,因此可以直接使用CAS维护(即内部控制方式)
         * 注意:这里说的持有锁指的是持有全局锁mainLock,虽然ReentrantLock底层实现也是CAS         
         */
        decrementWorkerCount();
        /**
         * 4.尝试终止线程池
         * 
         * 小问:那么为什么此时要尝试终止线程池呢?
         * 小答:因为新增线程失败的原因只有一个
         *       -> 线程池被关闭并进入终止流程
         *      具体可参见addWorker()方法
         */
        tryTerminate();
    } finally {
        //5.释放全局锁
        mainLock.unlock();
    }
}

processWorkerExit() - 线程回收处理

线程回收处理主要分两个部分:
1.回收该工作线程

2.根据需要新增工作线程

一.回收该工作线程主要有6个步骤:
1.因错误异常而被突然中断的线程,实际工作线程计数-1

2.获取全局锁

3.统计线程池总完成任务数

4.将该worker从workers集合中安全移除

5.释放全局锁

6.尝试终止线程池

二.若线程池状态为RUNNING或SHUTDOWN时,有两种情况需要新增工作线程:
1.线程因错误异常而被意外死亡

2.若非意外死亡,则至少保证有最小存活数个可用工作线程存活

private void processWorkerExit(Worker w, boolean completedAbruptly) {
    //1.因错误异常而被意外死亡的线程,实际工作线程计数-1
    if (completedAbruptly) 
        // If abrupt, then workerCount wasn't adjusted 作者大佬的注释真的没写错吗....
        decrementWorkerCount();
    //2.获取全局锁,主要目的是为了安全将worker从workers集合中移除 
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        //3.统计线程池总完成任务数
        completedTaskCount += w.completedTasks;
        //4.将该worker从workers集合中安全移除
        workers.remove(w);
    } finally {
        //5.释放全局锁
        mainLock.unlock();
    }
    /**
     * 6.尝试终止线程池
     * 小问:为什么此处需要尝试终止线程池?
     * 小答:由于processWorkerExit()方法只会在
     *      runWorker()中调用,而调用的时机有两个:
     *          1.工作线程因错误异常而被中断退出
     *          2.getTask()返回null
     *      根据tryTerminate()的终止条件可知,
     *      前者实际上并不会终止线程池,但问题是
     *      后者的getTask()是有可能因进入终止流程而返回null
     */
    tryTerminate();
    int c = ctl.get();
    /**
     * 若线程池状态为RUNNING或SHUTDOWN时,有两种情况需要新增工作线程
     *  1.线程因错误异常而被意外死亡
     *    -> 目的是填补这个意外死亡的工作线程造成的线程缺口(填坑)
     *  2.若非意外死亡,则至少保证有最小存活数个可用工作线程存活
     *    -> 目的是保证线程池正常运行或SHUTDOWN时有能力完成队列剩余任务
     */
    if (runStateLessThan(c, STOP)) {
        if (!completedAbruptly) {
            /**
             * 线程最小存活数由allowCoreThreadTimeOut和队列长度共同决定
             * 1.当allowCoreThreadTimeOut为true时,若队列非空,
             *   至少保证一个可用线程存活
             * 2.当allowCoreThreadTimeOut为false时,实际工作线程数
             *   一旦超过核心工作线程数,无须再新增工作线程了
             */
            int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
            //1.若允许响应核心工作线程超市且队列非空时
            if (min == 0 && ! workQueue.isEmpty())
                //至少保证一个可用线程可用
                min = 1;
            //2.实际工作线程数一旦超过核心工作线程数,无须再新增线程了
            if (workerCountOf(c) >= min)
                // replacement not needed
                //"替换"指的是替已死亡的线程继续填坑(完成剩余任务)
                return; 
        }
        /** 
         * 新增工作线程根据原因区分的目的有两个:
         *   1.因意外死亡的:
         *     -> 目的是为了填补线程空缺
         *   2.非意外死亡正常退出且队列非空:
         *     -> 处理任务队列中的剩余任务
         * 虽然目的有区别,但实际上作用是一致的:
         *     -> 都是为了处理队列任务(因为firstTask为null)
         */
        addWorker(null, false);
    }
}

任务队列与排队策略

任务队列是用于存储等待执行的任务的阻塞队列(在这里特指实现了BlockingQueue接口的阻塞队列实现类),其目的是为了实现数据缓存和共享;并发包原生提供了7种阻塞队列,根据界化可分成两部分:
-有界队列: 有界队列指的是容量有限,不允许无限拓展的队列,其最大可设置容量为Integer.MAX_VALUE,入队和出队都可能阻塞

有界队列(bounded): 必须给定出初始容量,包括ArrayBlockingQueue

可配队列(optionally-bounded): 不设置初始容量时默认最大容量为Integer.MAX_VALUE,包括LinkedBlockingQueueLinkedBlockingDeque

-无界队列:无界队列指的无边界,有两种情况分别是0和无限制

无边界(0):容量为0,不存储元素,无阻塞,如SynchronousQueue

无边界限制(unbounded): 允许容量无限拓展,直到抛出OutOfMemoryError,入队不会阻塞,出队才可能阻塞,包括DelayQueueLinkedTransferQueuePriorityBlockingQueue
注意:若不特别说明,阻塞队列都遵循FIFO先进先出规则

有界队列

有界队列指的是容量有限且固定,不容许无限拓展的阻塞队列,相对于无界队列来说,当maximumPoolSizes有限时可以有效防止资源耗尽,但也增加了控制的难度 -> 有界队列需要队列大小和最大线程数之间相互"妥协":

-大型队列+小型池:有效减少线程开销但可能降低吞吐量,若任务频繁阻塞,比如频繁I/O,
使用大型队列和小型池可以最大限度地降低CPU 使用率、操作系统资源和上下文切换开销,但是可能导致人工降低吞吐量。如果任务频繁阻塞(例如,如果它们是 I/O 边界),则系统可能为超过您许可的更多线程安排时间

-使用小型队列通常要求较大的池大小,CPU 使用率较高,但是可能遇到不可接受的调度开销,这样也会降低吞吐量

ArrayBlockingQueue

作用:
-由数组结构组成的有界阻塞队列

-除了定长数组外还包括两个int变量标识头部和尾部在数组中的位置

-入队和出队时不会产生或回收任何额外的对象

-支持公平和非公平模式,默认非公平锁

-内部采用一把锁+两个条件的同步方式,不能真正并发

LinkedBlockingQueue

作用:
-由链表结构组成的有界阻塞队列

-此队列的默认和最大长度为Integer.MAX_VALUE

-入队/出队时每次都会生成/销毁一个额外的Node对象,用于实现链表结构

-链表的吞吐通常要好于数组列表(理论上),理由自行谷歌ArrayList和LinkedList的区别

-内部采用两把锁+两个条件的同步方式,真正并发

-Executors.newFixedThreadPool()所用阻塞队列

坑点:
使用默认容量时,若生产速度远超过消费速度,可能在因队列满仓被阻塞之前内存资源就已经耗尽了

建议:
-通常只要使用LinkedBlockingQueue和ArrayListBlockingQueue就可以满足大部分生产-消费需求

LinkedBlockingDeque

作用:
-由链表结构组成的双端阻塞队列

-双端队列允许从队列双端入队和出队,具体表现在多了很多xxFirst和xxLast方法

-当没设置初始容量时,此队列默认使用最大容量值为Integer.MAX_VALUE

-同ArrayListBlockingQueue一样,内部采用一把锁+两个条件的同步方式,不能真正并发

无界队列

无界队列指的是容量无限大或容量为0的阻塞队列,在使用时需要注意:
1.当容量为0时则要慎重设置maxPoolSize以避免拒绝新提交的任务
2.当容量无限大时,就意味着maxPoolSize失效,设置该值无意义,创建线程数不会超过corePoolSize

适用场景:
当每个任务相互独立,相互无影响时最适合无界队列

SynchronousQueue

特点:
-不存储元素的阻塞队列,也是线程池默认任务队列类型

-队列不存储任务,只能进行线程之间的元素传送 -> 即直接提交

-支持公平模式和非公平模式,默认非公平(关于公平参见reentrantLock)

-Executors.newCachedThreadPool()所用阻塞队列

场景:
此策略可以避免在处理可能具有内部依赖性的请求集时出现锁

坑点:
-当不存在可用于立即运行的任务时,加入队列会失败,此时会新增一个新线程;但若超过maxPoolSize时会出现拒绝新提交的任务的问题!

-非公共模式下若生产和消费速度差距较大,很容易出现饥饿的情况,某些数据可能永远无法执行

建议:
-直接提交通常要求无界maximumPoolSizes以避免拒绝新提交的任务

-当命令以超过队列所能处理的平均数连续到达时,此策略允许无界线程具有增长的可能性

PriorityBlockingQueue

特点:
-由数组结构组成且具有优先级的无界阻塞队列,默认容量11

-默认自然排序,同时支持入队元素自定义顺序(实现Comparable接口)

-排序算法为堆排序,内部线程同步使用公平锁

-内部使用一把锁+一条件的同步方式:由于是无界队列,因此只需要一个 notEmpty非空条件即可

-值得注意的是只有头节点才保证优先级顺序,其他节点不保障

场景:
需要排序后的数组的时候
坑点:
由于使用堆排序,因此一旦消费速度远小于生产速度时,时间一长由于任务挤压再加上堆排序需要,很可能会耗尽所有的堆空间,即很容易内存溢出

建议:
土豪随意加内存,否则需要保证任务不要积压过多

DelayQueue

特点:
-使用优先级队列实现有序且获取延迟的阻塞无界队列

-入队元素必须实现Delayed接口,给定初识延时时间,只有到达延时时间才能从队列中获取到该元素,该元素不允许为null

-内部使用一把锁+一条件+优先级队列的同步方式:由于延迟特性,因此只需要一个available条件标示任务是否可用即可

场景:
-用于实现重试机制,多次延迟执行同时可支持重试次数限制

-ScheduledThreadPoolExecutor延迟线程池中的DelayedWorkQueue延迟阻塞队列是其的优化版本,用于定时调度等操作

-用于实现缓存,虽然推荐使用NoSQL

-TimerQueue的底层数据结构

LinkedTransferQueue

特点:
-由链表结构组成的无界阻塞队列

-TransferQueue是ConcurrentLinkedQueue、SynchronousQueue (公平模式下)、无界的LinkedBlockingQueues等的超集

-相对于其他阻塞队列LinkedTransferQueue多了tryTransfer()和transfer()方法

-当没有消费者在等待接收元素,transfer()方法会将元素存放在队列的tail节点,阻塞直到有消费者消费该元素才返回;否则直接传递给消费者
,此时不会入队

-区别于transfer(),tryTransfer()方法无论是否有消费者在等待接收元素,都会立即返回操作结果是成功或是失败,此时不会入队且非阻塞

-此类使用的复杂的双重数据结构,其方法都需要通过两个步骤实现:
保留:当消费者从队列中获取元素时发现队列为空,此时会创建一个数据字段为null的Node节点元素放入队列,然后消费者必须阻塞(自旋等待)直到此数据字段非空
传递: 当生产者准备向队列存入元素时发现最前面的元素的数据字段为null,此时它会直接把该元素的数据赋值给最前面的元素,即完成数据的传递

线程池的监控

原生监控

监控线程池的运行情况是挺重要的一件事情,尤其是定位问题的时候,所幸的是线程池原生给我们提供了几个监控属性可供get:
1.taskCount:线程池需要执行的任务数量(近似值)

2.completedTaskCount:线程池在运行过程中已完成的任务数量,小于或等于taskCount

3.largestPoolSize:线程池里曾经创建过的最大线程数,若该值与maxPoolSize一致的话说明线程池曾经满过

4.poolSize:线程池中线程数量,包括不在干活的工作线程数;值得注意的是若线程池不关闭的话,线程池中的线程不会被自动回收的,因此对于运行中的线程池来说该值只增不减

5.activeCount:正在运行中的工作线程数(近似值)

值得一提的是这些监控属性的get方法内部虽然都是使用全局锁维护的,但由于线程池运行期间的状态和线程数可以被动态调整,比如allowCoreThreadTimeOut()、setMaximumPoolSize()、setCorePoolSize()、shutdown()等等方法,因此有些值只能近似值

拓展监控

线程池提供了三个钩子方法可以用于拓展功能,比如监控任务的平均执行时间、最大执行时间和最小执行时间:
beforeExecute():位于runWorker()方法中,在run()方法前执行
afterExecute():位于runWorker()方法中,在run()方法后执行
terminated():位于tryTerminate()方法中,状态CAS为TIDYING之后执行
注意:由于上述方法都为protected且线程池中默认都是空方法,因此只能通过继承线程池或构造时才能重写上述方法

饱和拒绝策略

线程池的饱和拒绝策略主要用于拒绝任务(但这并不意味着该任务不会被执行),线程池原生提供了四种饱和拒绝策略,基本涵盖常见的饱和处理场景:

AbortPolicy:默认策略,直接抛出异常

CallerRunsPolic:只用调用线程执行该任务

DiscardPolicy:直接丢弃任务

DiscardOldestPolicy:丢弃队尾任务并用线程池重新尝试执行该任务

所有的拒绝策略都需要实现该拒绝处理器接口,以统一口径:

/**
 * 用于拒绝线程池任务的处理器
 */
public interface RejectedExecutionHandler {
    /**
     * 该方法用于拒绝接受线程池任务
     * 
     * 有三种情况可能调用该方法:
     *   1.没有更多的工作线程可用
     *   2.任务队列已满
     *   3.关闭线程池
     *
     * 当没有其他处理选择时,该方法会选择抛出RejectedExecutionException异常
     * 该异常会向上抛出直到execute()的调用者
     */
    void rejectedExecution(Runnable r, ThreadPoolExecutor executor);
}

CallerRunsPolicy

处理规则:新提交任务由调用者线程直接执行
推荐:拒绝策略推荐使用CallerRunsPolicy,理由是该策略不会抛弃任务,也不会抛出异常,而是将任务回退到调用者线程中执行

/**
 * 不会直接丢弃,而是直接用调用execute()方法的线程执行该方法
 * 当然一旦线程池已经被关闭,还是要丢弃的
 *
 * 补充:值得注意的是所有策略类都是public的静态内部类,
 *      其目的应该是告知使用者 -> 该类与线程池相关但无需线程池实例便可直接使用
 */
public static class CallerRunsPolicy implements RejectedExecutionHandler {
    public CallerRunsPolicy() { }
    /**
     * 直接使用调用该方法的线程执行任务
     * 除非线程池被关闭时才会丢弃该任务
     */
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
        //一旦线程池被关闭,丢弃该任务
        if (!e.isShutdown()) {
            //注意此时不是线程池执行该任务
            r.run();
        }
    }
}

AbortPolicy

处理规则:直接抛出RejectedExecutionException异常

/**
 * 简单、粗暴的直接抛出RejectedExecutionException异常
 */
public static class AbortPolicy implements RejectedExecutionHandler {
    public AbortPolicy() { }
    /**
     * 直接抛出异常,但r.toString()方法会告诉你哪个任务失败了
     * 更人性化的一点是 e.toString()方法还会告诉你:
     * 线程池的状态、工作线程数、队列长度、已完成任务数
     * 建议若是不处理异常起码也要在日志里面打印一下,留个案底
     */
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
        throw new RejectedExecutionException(
            "Task " + r.toString() + " rejected from " + e.toString());
    }
}

DiscardPolicy

处理规则:根据LIFO(后进先出)规则直接丢弃最新提交的任务

/**
 * 直接丢弃任务
 * 这个太狠了,连个案底都没有,慎用啊
 */
public static class DiscardPolicy implements RejectedExecutionHandler {
    public DiscardPolicy() { }
    /**
     * 无作为即为丢弃
     */
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
    }
}

DiscardOldestPolicy

处理规则:根据LRU(最近最少使用)规则丢弃最后一个任务,然后尝试执行新提交的任务

/**
 * 比起直接丢弃,该类会丢弃队列里最后一个但仍未被处理的任务,
 * 然后会重新调用execute()方法处理当前任务
 * 除非线程池被关闭时才会丢弃该任务
 * 此类充分证明了"来得早不如来的巧"
 */
public static class DiscardOldestPolicy implements RejectedExecutionHandler {
    public DiscardOldestPolicy() { }
    /**
     * 丢弃队列里最近的一个任务,并执行当前任务
     * 除非线程池被关闭时才会丢弃该任务
     * 原因是队列是遵循先进先出FIFO原则,poll()会弹出队尾元素
     */
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
        //一旦线程池被关闭,直接丢弃
        if (!e.isShutdown()) {
            //弹出队尾元素
            e.getQueue().poll();
            //直接用线程池执行当前任务
            e.execute(r);
        }
    }
}

线程池的异常处理

submit()异常处理

使用submit()处理异常时有四个注意事项:
使用submit()处理异常时有四个注意事项:
1.异常会保存在Future对象的ExecutionException中,可以在调用get()使用try-catch方式捕获,有N个任务有异常就会抛出来N个异常,但不会终止当前工作线程

2.单独设置UncaughtExceptionHandler没卵用,但结合(3)使用就有效

3.允许在submit()方法内部用try-catch捕获该异常,同样不会终止当前线程

4.若想在内部处理异常,还可以重写afterExecute()方法,例如:

static ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor(2, 3, 3, TimeUnit.SECONDS, new SynchronousQueue<>()) {
    //构造时直接重写afterExecute()方法
    protected void afterExecute(Runnable r, Throwable t) {
        super.afterExecute(r, t);
        printException(r, t);
    }
};
private static void printException(Runnable r, Throwable t) {
    if (t == null && r instanceof Future<?>) {
        try {
            Future<?> future = (Future<?>) r;
            if (future.isDone())
                future.get();
        } catch (ExecutionException e) {
            t = e.getCause();
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
        }
    }
    if (t != null) {
        System.out.println(t);
    }
}

execute()异常处理

使用execute()处理异常时有四个注意事项:
1.默认会在execute()方法内部直接抛出异常,注意这不会中断线程池运行,但会终止当前工作线程,并重新创建新的工作线程执行该任务

2.允许在execute()方法内部用try-catch捕获该异常,好处是不会终止当前线程并重新创建一个新的线程了

3.重写afterExecute()方法

4.还可以设置UncaughtExceptionHandler,例如:

ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor(1, 2, 3, TimeUnit.SECONDS, new LinkedBlockingQueue(), 
    //我们自定义一个线程工厂和重写线程的setUncaughtExceptionHandler方法
    new ThreadFactory() {
        final AtomicInteger threadNumber = new AtomicInteger(1);
        public Thread newThread(Runnable r) {
            Thread thread = new Thread(Thread.currentThread().getThreadGroup(), r, "thread-"
                    + (threadNumber.getAndIncrement()));
            thread.setUncaughtExceptionHandler((t,e) -> System.out.println(e));
            return thread;
        }
    });

3 FixedThreadPool

  • FixedThreadPool模式会使用一个优先固定数目的线程来处理若干数目的任务。
  • 规定数目的线程处理所有任务,一旦有线程处理完了任务就会被用来处理新的任务(如果有的话)。
  • FixedThreadPool模式下最多的线程数目是一定的。

3.1 创建FixedThreadPool对象代码如:

ExecutorService fixedThreadPool=Executors.newFixedThreadPool(5);
public static ExecutorService newFixedThreadPool(int nThreads) {
        return new ThreadPoolExecutor(nThreads, nThreads,
                                      0L, TimeUnit.MILLISECONDS,
                                      new LinkedBlockingQueue());
    }
  • FixedThreadPool的corePoolSize和maximumPoolSize参数都被设置为nThreads。
  • 当线程池中的线程数量大于corePoolSize时,keepAliveTime为非核心空闲线程等待新任务的最长时间,超过这个时间后非核心线程将被终止,这里keepAliveTime设置为0L,就说明非核心线程会立即被终止。
  • 事实上这里也没有非核心线程创建,因为核心线程数和最大线程数都一样的。

3.2 FixedThreadPool的execute()方法的运行流程:

05366de7b6e1a4d7edb5ef40cfa1d04f.png
  • 分析
  • (1)如果当前运行线程数少corePoolSize,则创建一个新的线程来执行任务。
  • (2)如果当前线程池的运行线程数等于corePoolSize,那么后面提交的任务将加入LinkedBlockingQueue。
  • (3)线程在执行完图中的1后,会在循环中反复从LinkedBlockingQueue获取任务来执行。
  • FixedThreadPool使用的是无界队列LinkedBlockingQueue作为线程池的工作队列(队列容量为Integer.MAX_VALUE)。使用该队列作为工作队列会对线程池产生如下影响
  • (1)当前线程池中的线程数量达到corePoolSize后,新的任务将在无界队列中等待。
  • (2)由于我们使用的是无界队列,所以参数maximumPoolSize和keepAliveTime无效。
  • (3)由于使用无界队列,运行中的FixedThreadPool不会拒绝任务(当然此时是未执行shutdown和shutdownNow方法),所以不会去调用RejectExecutionHandler的rejectExecution方法抛出异常。

3.3 例子

public class LiftOff implements Runnable{   
    protected int countDown = 10; //Default   
    private static int taskCount = 0;   
    private final int id = taskCount++;    
    public LiftOff() {}   
    public LiftOff(int countDown) {   
        this.countDown = countDown;   
    }   
    public String status() {   
        return "#" + id + "(" +   
            (countDown > 0 ? countDown : "LiftOff!") + ") ";   
    }   
    @Override   
    public void run() {   
        while(countDown-- > 0) {   
            System.out.print(status());   
            Thread.yield();   
        }   
           
    }      
} 

public class FixedThreadPool {   
    public static void main(String[] args) {  
        //三个线程来执行五个任务   
        ExecutorService exec = Executors.newFixedThreadPool(3);      
        for(int i = 0; i < 5; i++) {   
            exec.execute(new LiftOff());   
        }  
        exec.shutdown();   
    }   
} 

4 CachedThreadPool

  • 首先会按照需要创建足够多的线程来执行任务(Task)。
  • 随着程序执行的过程,有的线程执行完了任务,可以被重新循环使用时,才不再创建新的线程来执行任务。
  • 该线程池比较适合没有固定大小并且比较快速就能完成的小任务,它将为每个任务创建一个线程。
  • 那这样子它与直接创建线程对象(new Thread())有什么区别呢?看到它的第三个参数60L和第四个参数TimeUnit.SECONDS了吗?好处就在于60秒内能够重用已创建的线程。

4.1 创建方式

ExecutorService cachedThreadPool=Executors.newCachedThreadPool(); 
public static ExecutorService newCachedThreadPool() {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                      60L, TimeUnit.SECONDS,
                                      new SynchronousQueue());
    }
  • CachedThreadPool的corePoolSize被设置为0,而maximumPoolSize被设置Integer.MAX_VALUE,即maximumPoolSize是无界的
  • keepAliveTime被设置为60L,单位为妙。也就是空闲线程等待时间最长为60秒,超过该时间将会被终止。
  • CachedThreadPool使用的是没有容量的SynchronousQueue作为线程池的工作队列,
  • maximumPoolSize是无界的,也就是意味着如果主线程提交任务的速度高于maximumPoolSize中线程处理任务的速度时CachedThreadPool将会不断的创建新的线程,> * 在极端情况下,CachedThreadPool会因为创建过多线程而耗尽CPU和内存资源。

4.2 CachedThreadPool的execute()方法的运行流程

62b18a5895f868a001e1d63aa04453ce.png
  • 分析:
  • (1)首先执行SynchronousQueue.offer(Runnable task),添加一个任务。如果当前CachedThreadPool中有空闲线程正在执行SynchronousQueue.poll(keepAliveTime,TimeUnit.NANOSECONDS),其中NANOSECONDS是毫微秒即十亿分之一秒(就是微秒/1000),那么主线程执行offer操作与空闲线程执行poll操作配对成功,主线程把任务交给空闲线程执行,execute()方法执行完成,否则进入第(2)步。
  • (2)当CachedThreadPool初始线程数为空时,或者当前没有空闲线程,将没有线程去执行SynchronousQueue.poll(keepAliveTime,TimeUnit.NANOSECONDS)。这样的情况下,步骤(1)将会失败,此时CachedThreadPool会创建一个新的线程来执行任务,execute()方法执行完成。
  • (3)在步骤(2)中创建的新线程将任务执行完成后,会执行SynchronousQueue.poll(keepAliveTime,TimeUnit.NANOSECONDS),这个poll操作会让空闲线程最多在SynchronousQueue中等待60秒,如果60秒内主线程提交了一个新任务,那么这个空闲线程将会执行主线程提交的新任务,否则,这个空闲线程将被终止。由于空闲60秒的空闲线程会被终止,因此长时间保持空闲的 CachedThreadPool是不会使用任何资源的。
  • 根据前面的分析我们知道SynchronousQueue是一个没有容量的阻塞队列(其实个人认为是相对应时间而已的没有容量,因为时间到空闲线程就会被移除)。每个插入操作必须等到一个线程与之对应。CachedThreadPool使用SynchronousQueue,把主线程的任务传递给空闲线程执行。
0e67938fee286a2f0331325cf18a2bc8.png
public class CachedThreadPool {   
    public static void main(String[] args) {   
        ExecutorService exec = Executors.newCachedThreadPool();   
        for(int i = 0; i < 10; i++) {   
            exec.execute(new LiftOff());   
        }   
        exec.shutdown();       
    }   
} 

5 SingleThreadExecutor

  • 只会创建一个线程。它和FixedThreadPool比较类似,不过线程数是一个。
  • 如果多个任务被提交给SingleThreadExecutor的话,那么这些任务会被保存在一个队列中,并且会按照任务提交的顺序,一个先执行完成再执行另外一个线程。
  • SingleThreadExecutor模式可以保证只有一个任务会被执行。
  • 这种特点可以被用来处理共享资源的问题而不需要考虑同步的问题。

5.1 创建方式

ExecutorService singleThreadExecutor=Executors.newSingleThreadExecutor(); 
public static ExecutorService newSingleThreadExecutor() {
        return new FinalizableDelegatedExecutorService
            (new ThreadPoolExecutor(1, 1,
                                    0L, TimeUnit.MILLISECONDS,
                                    new LinkedBlockingQueue()));
    }
  • SingleThreadExecutor的corePoolSize和maximumPoolSize被设置为1,其他参数则与FixedThreadPool相同。
  • SingleThreadExecutor使用的工作队列也是无界队列LinkedBlockingQueue。
  • 由于SingleThreadExecutor采用无界队列的对线程池的影响与FixedThreadPool一样

5.2 运行流程

ac5ea59037a98fd62e9b082cccf33ddf.png
  • 分析:
  • (1)如果当前线程数少于corePoolSize即线程池中没有线程运行,则创建一个新的线程来执行任务。
  • (2)在线程池的线程数量等于corePoolSize时,将任务加入到LinkedBlockingQueue。
  • (3)线程执行完成(1)中的任务后,会在一个无限循环中反复从LinkedBlockingQueue获取任务来执行。

5.3 代码

public class SingleThreadExecutor {   
    public static void main(String[] args) {   
        ExecutorService exec = Executors.newSingleThreadExecutor();   
        for (int i = 0; i < 2; i++) {   
            exec.execute(new LiftOff());   
        }   
    }   
}  

6 比较

  • FixedThreadPool:适用于为了满足资源管理需求,而需要限制当前线程的数量的应用场景,它适用于负载比较重的服务器。
  • SingleThreadExecutor:适用于需要保证执行顺序地执行各个任务;并且在任意时间点,不会有多个线程是活动的场景。
  • CachedThreadPool:大小无界的线程池,适用于执行很多的短期异步任务的小程序,或者负载较轻的服务器。

参考

并发番@ThreadPoolExecutor一文通(1.8版)
[如何合理设置线程池大小]https://blog.csdn.net/u011519624/article/details/69263460
如何合理地估算线程池大小?

ExecutorService-10个要诀和技巧
聊聊并发(七)——Java中的阻塞队列

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,839评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,543评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,116评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,371评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,384评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,111评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,416评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,053评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,558评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,007评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,117评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,756评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,324评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,315评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,539评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,578评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,877评论 2 345

推荐阅读更多精彩内容