一、线程池实现原理
Java支持多线程,多线程可以提高任务的执行效率。但是Java里面的线程跟操作系统的线程是一一对应的,所以创建过多的线程会对系统资源产生很大的消耗,同时过多的线程竞争CPU,也会产生频繁的上下文切换,结果可能适得其反,降低系统的运行效率。
线程池的作用就是对线程的重复利用,把线程数量控制在合理的范围内,避免上述情况的产生。
线程池有几个部分组成:
- 任务队列:要执行的任务集合
- 活跃的线程:用来执行任务的线程
- 任务调度:控制任务执行
所以线程池的基本原理可以用下图来表示:
二、Java线程池类图
- Executor : 定义任务提交执行execute,执行的线程可能是新的线程,线程池的线程,或者调用者的线程,取决于线程池的实现。
- ExecutorService : 定义了有返回值的任务提交submit,线程池的中断。
- AbstractExecutorService : 实现submit方法
- ScheduledExecutorService : 定义定时执行的方法
- ThreadPoolExecutor : 线程池的主要实现类
- ScheduledThreadPoolExecutor : 实现定时执行线程池的逻辑
三、ThreadPoolExecutor源码分析
ThreadPoolExecutor是线程池的核心类,包含线程池的主要实现逻辑。
3.1、主要成员变量
- AtomicInteger ctl :表示线程池当前的状态(高3位)&有效线程数量(低29位)
- BlockingQueue<Runnable> workQueue : 任务队列
- HashSet<Worker> workers : 活跃线程集合
- int corePoolSize : 核心线程数
- int maximumPoolSize : 最大线程数
- RejectedExecutionHandler defaultHandler : 任务拒绝策略
3.2、execute
public void execute(Runnable command) {
if (command == null)
throw new NullPointerException();
int c = ctl.get();
if (workerCountOf(c) < corePoolSize) {
if (addWorker(command, true))
return;
c = ctl.get();
}
if (isRunning(c) && workQueue.offer(command)) {
int recheck = ctl.get();
if (! isRunning(recheck) && remove(command))
reject(command);
else if (workerCountOf(recheck) == 0)
addWorker(null, false);
}
else if (!addWorker(command, false))
reject(command);
}
提交任务时,如果当前线程数量小于核心线程数,不管是否有线程空闲,都会新建一个线程来执行任务,当线程数量大于核心线程,小于最大线程时,只有当workQueue满的时候,才会新建线程来执行,当线程数量等于最大线程数时,并且workQueue满的时候,会执行任务拒绝策略。
addWorder
private boolean addWorker(Runnable firstTask, boolean core) {
retry:
for (;;) {
int c = ctl.get();
int rs = runStateOf(c);
// Check if queue empty only if necessary.
if (rs >= SHUTDOWN &&
! (rs == SHUTDOWN &&
firstTask == null &&
! workQueue.isEmpty()))
return false;
for (;;) {
int wc = workerCountOf(c);
if (wc >= CAPACITY ||
wc >= (core ? corePoolSize : maximumPoolSize))
return false;
if (compareAndIncrementWorkerCount(c))
break retry;
c = ctl.get(); // Re-read ctl
if (runStateOf(c) != rs)
continue retry;
// else CAS failed due to workerCount change; retry inner loop
}
}
boolean workerStarted = false;
boolean workerAdded = false;
Worker w = null;
try {
final ReentrantLock mainLock = this.mainLock;
w = new Worker(firstTask);
final Thread t = w.thread;
if (t != null) {
mainLock.lock();
try {
// Recheck while holding lock.
// Back out on ThreadFactory failure or if
// shut down before lock acquired.
int c = ctl.get();
int rs = runStateOf(c);
if (rs < SHUTDOWN ||
(rs == SHUTDOWN && firstTask == null)) {
if (t.isAlive()) // precheck that t is startable
throw new IllegalThreadStateException();
workers.add(w);
int s = workers.size();
if (s > largestPoolSize)
largestPoolSize = s;
workerAdded = true;
}
} finally {
mainLock.unlock();
}
if (workerAdded) {
t.start();
workerStarted = true;
}
}
} finally {
if (! workerStarted)
addWorkerFailed(w);
}
return workerStarted;
}
Worker封装了执行任务的线程,它可以用一个任务初始化。新增一个worker首先判断当前线程池的状态还是否允许新增一个线程。如果可以,则会CAS更新workCount。然后new一个worker,调用worker线程的start方法。
worker线程是实现了Runnable的方法,worker线程会调用它的run方法,进而调用runWorker
final void runWorker(Worker w) {
Thread wt = Thread.currentThread();
Runnable task = w.firstTask;
w.firstTask = null;
w.unlock(); // allow interrupts
boolean completedAbruptly = true;
try {
while (task != null || (task = getTask()) != null) {
w.lock();
if ((runStateAtLeast(ctl.get(), STOP) ||
(Thread.interrupted() &&
runStateAtLeast(ctl.get(), STOP))) &&
!wt.isInterrupted())
wt.interrupt();
try {
beforeExecute(wt, task);
Throwable thrown = null;
try {
task.run();
} catch (RuntimeException x) {
thrown = x; throw x;
} catch (Error x) {
thrown = x; throw x;
} catch (Throwable x) {
thrown = x; throw new Error(x);
} finally {
afterExecute(task, thrown);
}
} finally {
task = null;
w.completedTasks++;
w.unlock();
}
}
completedAbruptly = false;
} finally {
processWorkerExit(w, completedAbruptly);
}
}
这个方法就会判断一些状态,然后调用Task的run方法,执行任务。
四、ScheduledThreadPoolExecutor源码分析
ScheduledThreadPoolExecutor 继承自ThreadPoolExecutor,本身自带了线程池的能力,只需要实现定时执行功能即可。
定时执行的基本原理是存储任务的队列是一个优先级队列,按执行时间的先后排序,任务线程去队列获取最近执行的任务,如果任务还没有到执行时间,则等待直到可以执行。
ScheduledThreadPoolExecutor 会把要定时执行的任务封装成一个ScheduledFutureTask。
ScheduledFutureTask 有几个成员变量:
- time 需要执行的时间
- period 执行周期
- sequenceNumber 序列号,如果时间相同,序列号小的先执行
利用这三个参数,结合优先级队列,可以实现定时执行。
DelayedWorkQueue.take
public RunnableScheduledFuture take() throws InterruptedException {
final ReentrantLock lock = this.lock;
lock.lockInterruptibly();
try {
for (;;) {
RunnableScheduledFuture first = queue[0];
if (first == null)
available.await();
else {
long delay = first.getDelay(TimeUnit.NANOSECONDS);
if (delay <= 0)
return finishPoll(first);
else if (leader != null)
available.await();
else {
Thread thisThread = Thread.currentThread();
leader = thisThread;
try {
available.awaitNanos(delay);
} finally {
if (leader == thisThread)
leader = null;
}
}
}
}
} finally {
if (leader == null && queue[0] != null)
available.signal();
lock.unlock();
}
}
先去获取位于队首的任务,如果为NULL则wait,然后看时间是否到达,如果到达了,返回任务,如果没有,则等待现在距离任务执行之间的时间差。
四、线程池使用注意
- 尽量使用 new ThreadPoolExecutor来构建线程池,这样可以自己去控制和判断线程池的大小。
- 如果是CPU密集型,线程数量可以设置为CPU核数+1
- 如果是IO密集型,线程数量可以设置为2*CPU核数+1