线程池详解(ThreadPoolExecutor)

转载于:https://mp.weixin.qq.com/s/O6PgmzET9R3HTwkc6kdvuQ

概述

现在在实现异步时,基本都是使用线程池来实现,线程池在工作应用的还是比较频繁的,本文将就线程池的使用、相关原理和主要方法源码进行深入学习。

线程池的基本使用

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
public class ThreadPoolExecutorTest {

/**
* 创建一个线程池(完整入参)
* 核心线程数(corePoolSize):5
* 最大线程数(maximumPoolSize):10
* 存活时间(keepAliveTime):60分钟
* 工作队列(workQueue):LinkedBlockingQueue
* 线程工厂(threadFactory):DefaultThreadFactory
* 饱和策略(handler):AbortPolicy-抛出异常
*/
private static ExecutorService threadPool = new ThreadPoolExecutor(
5,
10,
60,
TimeUnit.MINUTES,
new LinkedBlockingQueue<>(),
Executors.defaultThreadFactory(),
new ThreadPoolExecutor.AbortPolicy()
);

/**
* 单线程化线程池,只会用唯一的工作线程来执行任务,保证所有任务按照指定顺序(FIFO, LIFO, 优先级)执行
*
* 只有一个线程的线程池,没有超时时间
* 工作队列使用无界的LinkedBlockQueue
*/
private static ExecutorService singleThreadExecutor = Executors.newSingleThreadExecutor();

/**
* 定长线程池,可控制线程最大并发数,超出的线程会在队列中等待
*
* 有固定线程的线程池(即corePoolSize = maximumPoolSize)
* 没有超时时间,工作队列使用无界的LinkedBlockingQueue
*/
private static ExecutorService fixedThreadPool = Executors.newFixedThreadPool(3);

/**
* 可缓存线程池,如果线程池长度超过处理需要,可灵活回收空闲线程,若无可回收,则新建线程
*
* 大小不限的线程池,核心线程数为0,最大线程数为Integer.MAX_VALUE
* 存活时间为60秒,该线程池可以无限扩展,并且当需求降低时会自动收缩,
* 工作队列使用同步移交SynchronousQueue
*/
private static ExecutorService cachedThreadPool = Executors.newCachedThreadPool();

/**
* 定长线程池,支持定期执行任务
*/
private static ScheduledExecutorService scheduledThreadPool = Executors.newScheduledThreadPool(5);

public static void main(String[] args) throws ExecutionException, InterruptedException, TimeoutException {
//没有返回结果的异步任务
threadPool.submit(new Runnable() {
@Override
public void run() {
System.out.println("没有返回结果的异步任务");
}
});

//有返回结果的异步任务
Future<List<String>> future = threadPool.submit(new Callable<List<String>>() {
@Override
public List<String> call() throws Exception {
List<String> result = new ArrayList<>();
result.add("囧辉");
return result;
}
});
//获取返回结果
List<String> result = future.get();
System.out.println("有返回结果的异步任务:"+result);

//FutureTask的使用
Callable<String> task = new Callable<String>() {
@Override
public String call() throws Exception {
return "囧辉";
}
};
FutureTask<String> futureTo = new FutureTask<>(task);
threadPool.submit(futureTo);
//获取返回结果
System.out.println(futureTo.get());
//超时时间为3秒
//futureTo.get(3,TimeUnit.SECONDS);

//单线程化的线程池
for (int i = 0; i < 10; i++) {
final int index = i;
singleThreadExecutor.execute(new Runnable() {
@Override
public void run() {
System.out.println(index);
}
});
}

//定长线程池,可控制线程最大并发数
for (int i = 0; i < 10; i++) {
final int index = i;
fixedThreadPool.execute(new Runnable() {
@Override
public void run() {
System.out.println(index);
try {
Thread.sleep(2000);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
});
}

//可缓存线程池
for (int i = 0; i < 10; i++) {
final int index = i;
Thread.sleep(index*1000);

cachedThreadPool.execute(new Runnable() {
@Override
public void run() {
System.out.println(index);
}
});
}

//定长线程池,支持定期执行任务(延迟3秒执行)
scheduledThreadPool.schedule(new Runnable() {
@Override
public void run() {
System.out.println("delay 3 seconds");
}
},3,TimeUnit.SECONDS);

//定长线程池,支持定期执行任务(延迟1秒后每3秒执行一次)
scheduledThreadPool.scheduleAtFixedRate(new Runnable() {
@Override
public void run() {
System.out.println("delay 1 seconds,and execute every 3 seconds");
}
},1,3,TimeUnit.SECONDS);
}
}

线程池的定义和优点

线程池,从字面含义来看,是指管理一组同构工作线程的资源池。线程池是与工作队列密切相关的,其中在工作队列中保存了所有等待执行的任务。工作者线程的任务很简单:从工作队列中获取一个任务,执行任务,然后返回线程池并等待下一个任务。

“在线程池中执行任务”比“为每个线程分配一个任务”优势更多。通过重用现有的线程而不是创建线程,可以在处理多个请求时分摊在线程创建和销毁过程中产生的巨大开销。另一个额外的好处是,当请求到达时,工作线程通常已经存在,因此不会由于等待创建线程而延迟任务的执行,从而提高了响应性。通过适当的调整线程池的大小,可以创建足够的线程以便使处理器保持忙碌状态,同时还可以防止过多线程相互竞争资源而使应用程序耗尽内存或失败。

线程池的工作流程

线程的处理流程如下图所示:

![FD0_Y_`UMR4ADI9_5_B_IUI.png](https://s2.loli.net/2022/02/18/fPNWs73YDBCxhX2.png)

从图中可以看出,当提交一个新任务到线程池时,线程池的处理流程如下。

  1. 默认情况下,创建完线程池后并不会立即创建线程, 而是等到有任务提交时才会创建线程来进行处理。(除非调用prestartCoreThread或prestartAllCoreThreads方法)
  2. 当线程数小于核心线程数时,每提交一个任务就创建一个线程来执行,即使当前有线程处于空闲状态,直到当前线程数达到核心线程数。
  3. 当前线程数达到核心线程数时,如果这个时候还提交任务,这些任务会被放到工作队列里,等到线程处理完了手头的任务后,会来工作队列中取任务处理。
  4. 当前线程数达到核心线程数并且工作队列也满了,如果这个时候还提交任务,则会继续创建线程来处理,直到线程数达到最大线程数。
  5. 当前线程数达到最大线程数并且队列也满了,如果这个时候还提交任务,则会触发饱和策略。
  6. 如果某个线程的控线时间超过了keepAliveTime,那么将被标记为可回收的,并且当前线程池的当前大小超过了核心线程数时,这个线程将被终止。

工作队列

如果新请求的到达速率超过了线程池的处理速率,那么新到来的请求将累积起来。在线程池中,这些请求会在一个由Executor管理的Runnable队列中等待,而不会像线程那样去竞争CPU资源。常见的工作队列有以下几种,前三种用的最多。

  1. ArrayBlockingQueue:列表形式的工作队列,必须要有初始队列大小,有界队列,先进先出。
  2. LinkedBlockingQueue:链表形式的工作队列,可以选择设置初始队列大小,有界/无界队列,先进先出。
  3. SynchronousQueue:SynchronousQueue不是一个真正的队列,而是一种在线程之间移交的机制。要将一个元素放入SynchronousQueue中, 必须有另一个线程正在等待接受这个元素. 如果没有线程等待,并且线程池的当前大小小于最大值,那么ThreadPoolExecutor将创建 一个线程, 否则根据饱和策略,这个任务将被拒绝。使用直接移交将更高效,因为任务会直接移交 给执行它的线程,而不是被首先放在队列中, 然后由工作者线程从队列中提取任务. 只有当线程池是无解的或者可以拒绝任务时,SynchronousQueue才有实际价值。
  4. PriorityBlockingQueue:优先级队列,有界队列,根据优先级来安排任务,任务的优先级是通过自然顺序或Comparator(如果任务实现了Comparator)来定义的。
  5. DelayedWorkQueue:延迟的工作队列,无界队列。

饱和策略(拒绝策略)

当有界队列被填满后,饱和策略开始发挥作用。ThreadPoolExecutor的饱和策略可以通过调用setRejectedExecutionHandler来修改。(如果某个任务被提交到一个已被关闭的Executor时,也会用到饱和策略)。饱和策略有以下四种,一般使用默认的AbortPolicy。

  1. AbortPolicy:中止策略。默认的饱和策略,抛出未检查的RejectedExecutionException。调用者可以捕获这个异常,然后根据需求编写自己的处理代码。
  2. DiscardPolicy:抛弃策略。当新提交的任务无法保存到队列中等待执行时,该策略会悄悄抛弃该任务。
  3. DiscardOldestPolicy:抛弃最旧的策略。当新提交的任务无法保存到队列中等待执行时,则会抛弃下一个将被执行的任务,然后尝试重新提交新的任务。(如果工作队列是一个优先队列,那么“抛弃最旧的”策略将导致抛弃优先级最高的任务,因此最好不要将“抛弃最旧的”策略和优先级队列放在一起使用)。
  4. CallerRunsPolicy:调用者运行策略。该策略实现了一种调节机制,该策略既不会抛弃任务,也不会抛出异常,而是将某些任务回退到调用者(调用线程池执行任务的主线程),从而降低新任务的流程。它不会在线程池的某个线程中执行新提交的任务,而是在一个调用了execute的线程中执行该任务。当线程池的所有线程都被占用,并且工作队列被填满后,下一个任务会在调用execute时在主线程中执行(调用线程池执行任务的主线程)。由于执行任务需要一定时间,因此主线程至少在一段时间内不能提交任务,从而使得工作者线程有时间来处理完正在执行的任务。在这期间,主线程不会调用accept,因此到达的请求将被保存在TCP层的队列中。如果持续过载,那么TCP层将最终发现它的请求队列被填满,因此同样会开始抛弃请求。当服务器过载后,这种过载情况会逐渐向外蔓延开来——从线程池到工作队列到应用程序再到TCP层,最终达到客户端,导致服务器在高负载下实现一种平缓的性能降低。

线程工厂

每当线程池需要创建一个线程时,都是通过线程工厂方法来完成的。在ThreadFactory中只定义了一个方法newThread,每当线程池需要创建一个新线程时都会调用这个方法。Executors提供的线程工厂有两种,一般使用默认的,当然如果有特殊需求,也可以自己定制。

  1. DefaultThreadFactory:默认线程工厂,创建一个新的、非守护的线程,并且不包含特殊的配置信息。
  2. PrivilegedThreadFactory:通过这种方式创建出来的线程,将与创建privilegedThreadFactory的线程拥有相同的访问权限、 AccessControlContext、ContextClassLoader。如果不使用privilegedThreadFactory, 线程池创建的线程将从在需要新线程时调用execute或submit的客户程序中继承访问权限。
  3. 自定义线程工厂:可以自己实现ThreadFactory接口来定制自己的线程工厂方法。

ThreadPoolExecutor源码解析

了解这几个点,有助于你阅读下面的源码解释。

  1. 下面的源码解读中提到的运行状态就是runState,有效的线程数就是workerCount,内容比较多,所以可能两种写法都用到。
  2. 运行状态的一些定义:RUNNING:接受新任务并处理排队任务; SHUTDOWN:不接受新任务,但处理排队任务; STOP:不接受新任务,不处理排队任务,并中断正在进行的任务;TIDYING:所有任务已经终止,workerCount为零,线程转换到状态TIDYING将运行terminate()钩子方法;TERMINATED:terminated()已经完成,该方法执行完毕代表线程池已经完全终止。
  3. 运行状态之间并不是随意转换的,大多数状态都只能由固定的状态转换而来,转换关系见第4点~第8点。
  4. RUNNING - > SHUTDOWN:在调用shutdown()时,可能隐含在finalize()。
  5. (RUNNING or SHUTDOWN) -> STOP:调用shutdownNow()。
  6. SHUTDOWN - > TIDYING:当队列和线程池都是空的时。
  7. STOP - > TIDYING:当线程池为空时。
  8. TIDYING - > TERMINATED:当terminate()方法完成时。

基础属性(很重要)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
/**
* 主池控制状态ctl是包含两个概念字段的原子整数:workerCount:指有效的线程数量;000000000000000000000000000000000000000000000000000000000000000
* runState:指运行状态,运行,关闭等。为了将workerCount和runState用1个int来表示
* 我们限制workerCount范围为(2^29)-1,即用int的低29位用来表示workerCount,
* 用int的高3位用来表示runState,这样workerCount和runState刚好用int可以完整表示。
*/
/**
* 初始化时有效的线程数为0,此时ctl为:1010 0000 0000 0000 0000 0000 0000 0000
*/
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
/**
* 高3位用来表示运行状态,此值用于运行状态向左移动的位数,即29位
*/
private static final int COUNT_BITS = Integer.SIZE - 3;
/**
* 线程数容量,低29位表示有效的线程数,0001 1111 1111 1111 1111 1111 1111 1111
*/
private static final int CAPACITY = (1 << COUNT_BITS) - 1;

/**
* 大小关系:RUNNING<SHUTDOWN<STOP<TIDYING<TERMINATED,
* 源码中频繁使用大小关系来作为条件判断。
* 1010 0000 0000 0000 0000 0000 0000 0000 运行
* 0000 0000 0000 0000 0000 0000 0000 0000 关闭
* 0010 0000 0000 0000 0000 0000 0000 0000 停止
* 0100 0000 0000 0000 0000 0000 0000 0000 整理
* 0110 0000 0000 0000 0000 0000 0000 0000 终止
*/
private static final int RUNNING = -1 << COUNT_BITS; //运行
private static final int SHUTDOWN = 0 << COUNT_BITS; //关闭
private static final int STOP = 1 << COUNT_BITS; //停止
private static final int TIDYING = 2 << COUNT_BITS; //整理
private static final int TERMINATED = 3 << COUNT_BITS; //终止

/**
* 得到运行状态:入参c为ctl的值,~CAPACITY高3位为1低29位全为0,因此运算结果为ctl的高3位,也就是运行状态
*/
private static int runStateOf(int c) { return c & ~CAPACITY; }

/**
* 得到有效的线程数:入参c为ctl的值,CAPACITY高3位为0,低29位全为1,因此运算结果为ctl的低29位,也就是有效的线程数
*/
private static int workerCountOf(int c) { return c & CAPACITY; }

/**
* 得到ctl的值:高3位的运行状态和低29位的有效线程数进行或运算,组合成一个完成32位数
*/
private static int ctlOf(int rs, int wc) { return rs | wc; }

/**
* 状态c是否小于s
*/
private static boolean runStateLessThan(int c, int s) {
return c < s;
}

/**
* 状态c是否大于等于s
*/
private static boolean runStateAtLeast(int c, int s) {
return c >= s;
}

/**
* 状态c是否为RUNNING(小于SHUTDOWN的状态只有RUNNING)
*/
private static boolean isRunning(int c) {
return c < SHUTDOWN;
}

/**
* 使用CAS增加一个有效的线程
*/
private boolean compareAndIncrementWorkerCount(int expect) {
return ctl.compareAndSet(expect, expect + 1);
}

/**
* 使用CAS减少一个有效的线程
*/
private boolean compareAndDecrementWorkerCount(int expect) {
return ctl.compareAndSet(expect, expect - 1);
}

/**
* 减少一个有效的线程
*/
private void decrementWorkerCount() {
do {} while (! compareAndDecrementWorkerCount(ctl.get()));
}

/**
* 工作队列
*/
private final BlockingQueue<Runnable> workQueue;

/**
* 锁
*/
private final ReentrantLock mainLock = new ReentrantLock();

/**
* 包含线程池中的所有工作线程,只有在mainLock的情况下才能访问,Worker集合
*/
private final HashSet<Worker> workers = new HashSet<Worker>();
private final Condition termination = mainLock.newCondition();

/**
* 跟踪线程池的最大到达大小,仅在mainLock下访问
*/
private int largestPoolSize;

/**
* 总的完成的任务数
*/
private long completedTaskCount;

/**
* 线程工厂,用于创建线程
*/
private volatile ThreadFactory threadFactory;

/**
* 拒绝策略
*/
private volatile RejectedExecutionHandler handler;

/**
* 线程超时时间,当线程数超过corePoolSize时失效,如果有线程空闲时间超过keepAliveTime,则会被终止
*/
private volatile long keepAliveTime;

/**
* 是否允许核心线程超时,默认false,false情况下核心线程会一直存活
*/
private volatile boolean allowCoreThreadTimeOut;

/**
* 核心线程数
*/
private volatile int corePoolSize;

/**
* 最大线程数
*/
private volatile int maximumPoolSize;

/**
* 默认饱和策略(拒绝策略),抛异常
*/
private static final RejectedExecutionHandler defaultHandler =
new ThreadPoolExecutor.AbortPolicy();

private final class Worker
extends AbstractQueuedSynchronizer
implements Runnable
{
private static final long serialVersionUID = 6138294804551838833L;

/**
* Worker对应的线程
*/
final Thread thread;

/**
* 运行的初始任务
*/
Runnable firstTask;

/**
* 每个线程的任务计数器
*/
volatile long completedTasks;

Worker(Runnable firstTask) {
setState(-1); // 禁止中断,直到runWorker
this.firstTask = firstTask; // 设置为初始任务
this.thread = getThreadFactory().newThread(this); // 使用线程工厂创建一个线程
}

public void run() { // 将主运行循环委托给外部runWorker
runWorker(this);
}

/**
* 通过AQS的同步状态来实现锁机制。state为0时代表锁未被获取(解锁状态),state为1时代表锁已经被获取(加锁状态)
*/
protected boolean isHeldExclusively() {
return getState() != 0;
}

/**
* 尝试获取锁
*/
protected boolean tryAcquire(int unused) {
if (compareAndSetState(0, 1)) { // 使用CAS尝试将state设置为1,即尝试获取锁
setExclusiveOwnerThread(Thread.currentThread()); // 成功将state设置为1,则当前线程拥有独占访问权
return true;
}
return false;
}

/**
* 尝试释放锁
*/
protected boolean tryRelease(int unused) {
setExclusiveOwnerThread(null); // 释放独占访问权,即将独占访问线程设为null
setState(0); // 解锁:将state设置为0
return true;
}

/**
* 加锁
*/
public void lock() { acquire(1); }

/**
* 尝试加锁
*/
public boolean tryLock() { return tryAcquire(1); }

/**
* 解锁
*/
public void unlock() { release(1); }

/**
* 是否为加锁状态
*/
public boolean isLocked() { return isHeldExclusively(); }

/**
* 如果线程启动了,则进行中断
*/
void interruptIfStarted() {
Thread t;
if (getState() >= 0 && (t = thread) != null && !t.isInterrupted()) {
try {
t.interrupt();
} catch (SecurityException ignore) {
}
}
}
}

execute方法

使用线程池的submit方法提交任务时,会走到该方法,该方法也是线程池最重要的方法。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
public void execute(Runnable command) {
if (command == null) // 为空校验
throw new NullPointerException();
int c = ctl.get(); // 拿到当前的ctl值
if (workerCountOf(c) < corePoolSize) { // 如果有效的线程数小于核心线程数
if (addWorker(command, true)) // 则新建一个线程来处理任务(核心线程)
return;
c = ctl.get(); // 拿到当前的ctl值
}
// 走到这里说明有效的线程数已经>=核心线程数
if (isRunning(c) && workQueue.offer(command)) { // 如果当前状态是运行,尝试将任务放入工作队列
int recheck = ctl.get(); // 再次拿到当前的ctl值
if (! isRunning(recheck) && remove(command)) //如果再次检查状态不是运行,则将刚才添加到工作队列的任务移除
reject(command); // 并调用拒绝策略
else if (workerCountOf(recheck) == 0) // 如果再次检查时,有效的线程数为0
addWorker(null, false); // 则新建一个线程(非核心线程)
}
// 走到这里说明工作队列已满
else if (!addWorker(command, false)) // 尝试新建一个线程来处理任务(非核心)
reject(command); // 如果失败则调用拒绝策略
}

该方法就是对应上文的线程池的工作流程。主要调用到的方法为addWorker(见下文addWorker方法解读)。

addWorker方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
private boolean addWorker(Runnable firstTask, boolean core) {
retry:
for (;;) {
int c = ctl.get(); // c赋值为ctl
int rs = runStateOf(c); // rs赋值为运行状态

/**
* 1.如果池停止或有资格关闭,则此方法返回false
* 如果线程工厂在询问时未能创建线程,它也返回false
* 包括以下5种情况:
* 1).rs为RUNNING,通过校验
* 2).rs为STOP或TIDYING或TERMINATED,返回false
* (STOP、TIDYING、TERMINATED:已经停止进入最后清理终止,不接受任务不处理队列任务)
* 3).rs为SHUTDOWN,提交的任务不为空,返回false
* (SHUTDOWN:不接受任务但是处理队列任务,因此任务不为空返回false)
* 4).rs为SHUTDOWN,提交的任务为空,并且工作队列为空,返回false
* (状态为SHUTDOWN、提交的任务为空、工作队列为空,则线程池有资格关闭,直接返回false)
* 5).rs为SHUTDOWN,提交的任务为空,并且工作队列不为空,通过校验
* (因为SHUTDOWN状态下刚好可以处理队列任务)
*/
if (rs >= SHUTDOWN &&
! (rs == SHUTDOWN &&
firstTask == null &&
! workQueue.isEmpty()))
return false;

for (;;) {
int wc = workerCountOf(c); // 拿到有效的线程数
// 校验有效的线程数是否超过阈值
if (wc >= CAPACITY ||
wc >= (core ? corePoolSize : maximumPoolSize))
return false;
// 使用CAS将workCount+1,修改成功则跳出循环,否则进入下面的状态中断
if (compareAndIncrementWorkerCount(c))
break retry;
c = ctl.get(); // 重新读取ctl
// 判断当前运行状态,如果不等于上面获取的运行状态rs,说明rs被其它线程修改了,跳到retry重新校验线程池状态
if (runStateOf(c) != rs)
continue retry;
// 走到这里说明compareAndIncrementWorkerCount失败;
// 重试内部循环(状态没变,则继续内部循环,尝试使用CAS修改workerCount)
}
}

boolean workerStarted = false; // Worker的线程是否启动
boolean workerAdded = false; // Worker是否成功增加
ThreadPoolExecutor.Worker w = null;
try {
w = new ThreadPoolExecutor.Worker(firstTask); // 用firstTask和当前线程创建一个Worker
final Thread t = w.thread; // 拿到Worker对应的线程
if (t != null) {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock(); // 加锁
try {
int rs = runStateOf(ctl.get()); // 加锁的情况下重新获取当前的运行状态
// 如果当前的运行状态为RUNNING,或者当前的运行状态为SHUTDOWN并且firstTask为空,则通过校验
if (rs < SHUTDOWN ||
(rs == SHUTDOWN && firstTask == null)) {
if (t.isAlive()) // 预先校验线程是可以启动的
throw new IllegalThreadStateException();
workers.add(w); // 将刚创建的worker添加到工作者列表
int s = workers.size();
if (s > largestPoolSize)
largestPoolSize = s;
workerAdded = true;
}
} finally {
mainLock.unlock();
}
if (workerAdded) { // 如果Worker添加成功,则启动线程执行
t.start();
workerStarted = true;
}
}
} finally {
if (! workerStarted) // 如果Worker的线程没有成功启动
addWorkerFailed(w); // 则进行回滚,移除之前添加的Worker
}
return workerStarted;
}

该方法主要目的就是使用入参中的firstTask和当前线程添加一个Worker,前面的for循环主要是对当前线程池的运行状态和有效的线程数进行一些校验,校验逻辑比较绕,可以参考注释进行理解。该方法涉及到的其他方法有addWorkerFailed(见下文addWorkerFailed源码解读);还有就是Worker的线程启动时,会调用Worker里的run方法,执行runWorker(this)方法(见下文runWorker源码解读)。

addWorkerFailed方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
/**
* 回滚Worker的添加,就是将Worker移除
*/
private void addWorkerFailed(ThreadPoolExecutor.Worker w) {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock(); // 加锁
try {
if (w != null)
workers.remove(w); // 移除Worker
decrementWorkerCount(); // 有效线程数-1
tryTerminate(); // 有Worker线程移除,可能是最后一个线程退出,需要尝试终止线程池
} finally {
mainLock.unlock(); // 解锁
}
}

该方法很简单,就是移除入参中的Worker并将workerCount-1,最后调用tryTerminate尝试终止线程池,tryTerminate见下文对应方法源码解读。

runWorker方法

上文addWorker方法里说道,当Worker里的线程启动时,就会调用该方法。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
final void runWorker(ThreadPoolExecutor.Worker w) { // Worker的线程开始执行任务
Thread wt = Thread.currentThread(); // 获取当前线程
Runnable task = w.firstTask; //拿到Worker的初始任务
w.firstTask = null;
w.unlock(); // 允许中断
boolean completedAbruptly = true; // Worker是不是因异常而死亡
try {
while (task != null || (task = getTask()) != null) { // Worker取任务执行
w.lock(); // 加锁
/**
* 如果线程池停止,确保线程中断;如果不是,确保线程不被中断
* 在第二种情况下进行重新检查,以便在清除中断的同时处理shutdownNow竞争
* 线程池停止指运行状态为STOP、TIDYING、TERMINATED中的一种
*/
if ((runStateAtLeast(ctl.get(), STOP) || // 判断线程池运行状态
(Thread.interrupted() &&
runStateAtLeast(ctl.get(), STOP))) && // 再次判断线程池运行状态
!wt.isInterrupted()) // 走到这里代表线程池运行状态为停止,检查wt是否中断
wt.interrupt(); // 线程池的状态为停止并且wt不为中断,则将wt中断
try {
beforeExecute(wt, task); // 执行beforeExecute(默认空,需要自己重写)
Throwable thrown = null;
try {
task.run(); // 执行任务
} catch (RuntimeException x) {
thrown = x; throw x; // 如果抛异常,则completedAbruptly为true
} catch (Error x) {
thrown = x; throw x;
} catch (Throwable x) {
thrown = x; throw new Error(x);
} finally {
afterExecute(task, thrown); // 执行afterExecute(需要自己重写)
}
} finally {
task = null; // 将执行完的任务清空
w.completedTasks++; // Worker完成任务数+1
w.unlock();
}
}
completedAbruptly = false; // 如果执行到这里,则worker是正常退出
} finally {
processWorkerExit(w, completedAbruptly); // 调用processWorkerExit方法
}
}

该方法为Worker线程开始执行任务,首先执行当初创建Worker时的初始任务,接着从工作队列中获取任务执行。主要涉及两个方法:获取任务的方法getTask(见下文getTask源码解读)和执行Worker退出的方法processWorkerExit(见下文processWorkerExit源码解读)。注:processWorkerExit在处理正常Worker退出时,没有对workerCount-1,而是在getTask方法中进行workerCount-1。

getTask方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
private Runnable getTask() { // Worker从工作队列获取任务
boolean timedOut = false; // poll方法取任务是否超时

for (;;) { // 无限循环
int c = ctl.get(); // ctl
int rs = runStateOf(c); // 当前运行状态

/**
* 如果线程池运行状态为停止,或者可以停止(状态为SHUTDOWN并且队列为空),则返回null,代表当前worker需要移除
*/
if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
decrementWorkerCount(); // 将workerCount-1
// 返回null前将workerCount-1,因此processWorkerExit中completedAbruptly=false时无需再减
return null;
}

int wc = workerCountOf(c); // 当前的workerCount

/**
* 判断当前的Worker是否可以被移除,即当前Worker是否可以一直等待任务
* 如果allowCoreThreadTimeOut为true,或者workerCount大于核心线程数,则当前线程是有超时时间的(keepAliveTime),无法一直等待任务
*/
boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;

/**
* 如果wc超过最大线程数或者当前线程会超时并且已经超时,
* 并且wc>1或者工作队列为空,则返回null,代表当前worker需要移除
*/
if ((wc > maximumPoolSize || (timed && timedOut))
&& (wc > 1 || workQueue.isEmpty())) {
if (compareAndDecrementWorkerCount(c))
// 返回null前将workerCount-1,因此processWorkerExit中completedAbruptly=false时无需再减
return null;
continue;
}

try {
/**
* 根据线程是否会超时调用相应的方法
* poll为带超时的获取任务方法
* take()为不带超时的获取任务方法,会一直阻塞直到获取到任务
*/
Runnable r = timed ?
workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
workQueue.take();
if (r != null)
return r;
timedOut = true; // 走到这里代表当前线程获取任务超时
} catch (InterruptedException retry) {
timedOut = false; // 被中断
}
}
}

Worker从工作队列获取任务,如果allowCoreThreadTimeOut为false并且 workerCount<=corePoolSize,则这些核心线程永远存活,并且一直在尝试获取工作队列的任务;否则,线程会有超时时间(keepAliveTime),当在keepAliveTime时间内获取不到任务,该线程的Worker会被移除。

Worker移除的过程:getTask方法返回null,导致runWorker方法中跳出while循环,调用processWorkerExit方法将Worker移除。注意:在返回null的之前,已经将workerCount-1,因此在processWorkerExit中,completedAbruptly=false的情况(即正常超时退出)不需要再将workerCount-1。

processWorkerExit方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
private void processWorkerExit(ThreadPoolExecutor.Worker w, boolean completedAbruptly) { // Worker的退出
/**
* 如果Worker是异常死亡(completedAbruptly=true),则workerCount-1
* 如果completedAbruptly为false的时候(正常超时退出),则代表task=getTask()等于null
* getTask()方法中返回null的地方,都已经将workerCount-1,所以此处无需再-1
*/
if (completedAbruptly)
decrementWorkerCount();

final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
completedTaskCount += w.completedTasks; // 该Worker完成的任务数加到总完成的任务数
workers.remove(w); // 移除该Worker
} finally {
mainLock.unlock();
}

tryTerminate(); // 有Worker线程移除,可能是最后一个线程退出,需要尝试终止线程池

int c = ctl.get(); // 获取当前的ctl
if (runStateLessThan(c, STOP)) { //如果线程池的运行状态还没停止(RUNNING或SHUTDOWN)
if (!completedAbruptly) { // 如果Worker不是异常死亡
// min为线程池的理论最小线程数:如果允许核心线程数超时,则min为0,否则min为核心线程数
int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
// 如果min为0,工作队列不为空,将min设置为1,确保至少有1个Worker来处理队列里的任务
if (min == 0 && ! workQueue.isEmpty())
min = 1;
// 当前有效的线程数>=min,直接返回
if (workerCountOf(c) >= min)
return; // replacement not needed
// 如果代码走到这边,代表workerCountOf(c)<min,此时会走到下面的addWorker方法
// 通过getTask方法我们知道,当allowCoreThreadTimeOut为false,并且workerCount<=corePoolSize时,是不会走到processWorkerExit方法的
// 因此走到这边只可能是当前移除的Worker是最后一个Worker,但是此时工作队列还不为空,因此min被设置成了1,所以需要添加一个Worker来处理工作队列
}
addWorker(null, false); // 添加一个Worker
}
}

该方法就是执行Worker的退出:统计完成的任务数,将Worker移除,并尝试终止线程池,最后根据情况决定是否创建一个新的Worker。两种情况下会创建一个新的Worker:1)被移除的Worker是由于异常而死亡;2)被移除的Worker是最后一个Worker,但是工作队列还有任务。completedAbruptly=false时,没有将workerCount-1是因为已经在getTask方法中将workerCount-1。

tryTerminate方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
final void tryTerminate() { // 尝试终止线程池
for (;;) {
int c = ctl.get();
// 只有当前状态为STOP或者SHUTDOWN并且队列为空,才会尝试整理并终止
// 1.当前状态为RUNNING,则不尝试终止,直接返回
// 2.当前状态为TIDYING或者TERMINATED,代表有其它线程正在执行终止,直接返回
// 3.当前状态为SHUTDOWN并且workQueue不为空,则不尝试终止,直接返回
if (isRunning(c) || // 1
runStateAtLeast(c, TIDYING) || // 2
(runStateOf(c) == SHUTDOWN && ! workQueue.isEmpty())) // 3
return;
// 走到这里代表线程池可以终止(通过上面的校验)
// 如果此时有效线程数不为0,将中断一个空闲的Worker,以确保关闭信号传播
if (workerCountOf(c) != 0) { // Eligible to terminate
interruptIdleWorkers(ONLY_ONE);
return;
}

final ReentrantLock mainLock = this.mainLock;
mainLock.lock(); // 加锁,终止线程池
try {
// 使用CAS将ctl的运行状态设置为TIDYING,有效线程数设置为0
if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {
try {
terminated(); // 供用户重写的terminated方法,默认为空
} finally {
// 将ctl的运行状态设置为TERMINATED,有效线程数设置为0
ctl.set(ctlOf(TERMINATED, 0));
termination.signalAll();
}
return;
}
} finally {
mainLock.unlock();
}
// else retry on failed CAS
}
}

该方法用来尝试终止线程池,主要在移除Worker后会调用此方法。首先进行一些状态的校验,如果通过校验,则在加锁的条件下,使用CAS将运行状态设为TERMINATED,有效线程数设为0。