1 什么是ThreadLocal
ThreadLocal是什么呢?在实际开发中经常被用来绑定用户信息、日志号。数据库连接等等。这样一来,我们编码时就不用通过传递参数方式而影响业务逻辑。就如名字一般,我们可以简单的认为它的作用就是把数据绑定到当前线程上,然后用于后续的操作。
既然是将数据绑定到当前线程上,那最方便高效的数据存储方式就是key-value的hash方式存储了。不过不同于HashMap的实现方式,它单独提供了一个叫做ThreadLocalMap的Map类,与HashMap有着类似的功能,但是区别是它的KEY使用弱引用(只要GC扫描到,只有弱引用的情况下就会被回收)。
static class ThreadLocalMap {
static class Entry extends WeakReference<ThreadLocal<?>> {
/** The value associated with this ThreadLocal. */
Object value;
Entry(ThreadLocal<?> k, Object v) {
super(k);
value = v;
}
}
}
2 ThreadLocalMap的KEY为什么设计成弱引用
为什么ThreadLocalMap和HashMap的key不同,会设计成弱引用呢?我们来分析一下:
HashMap被程序员使用存储各类数据,ThreadLocalMap为静态访问修饰符为Default的类,只为线程Thread存储数据(其属性)。
看一下类注释:To help deal withvery large and long-lived usages, the hash table entries use WeakReferences for keys。解释一下:为了帮助处理巨大和长时间存活的对象使用,才会使用弱引用。
所以总结上面两点,我们就知道。ThreadLocalMap不像HashMap一样被外部使用,可以认为是线程私有的Map,这就意味着:在线程长时间存活的情况下,如果ThreadLocalMap没有使用弱引用,而是使用HashMap的话。当Map中被放入大量大对象和值时,又不及时手动删除K-V的话就很可能会出现应用堆栈溢出的情况。但是如果使用弱引用的话,那么在没有其他强引用的时候,就不需要程序员手动去删除K-V,再一定程度上会降低堆栈溢出的风险(要是KEY都被外部强引用,那也没办法啊)。
3 ThreadLocal为什么内存泄露
由于使用了弱引用,就有可能造成网上经常说的内存泄露?(其实感觉没有恐怖)我们先说这个内存泄漏是怎么产生的呢?如下图:
图上我们可以看到当ThreadLocal的实例如果设置为null,那么之后实例会被回收。这个时候ThreadLocal,也就是ThreadLocalMap的key仅有一个弱引用了,说明GC时KEY会被回收。当回收后我们就会发现V这个值就被留在了Map当中了,我们无法获取,也无法删除。这就是所谓的内存泄露问题。
不过我们也发现只要线程销毁后,ThreadLocalMap也会被回收就解决了线程泄露的问题。但是如果线程长时间存活那就麻烦了。还有一种情况就是在使用线程池的时候。我们都知道线程池里的线程都是复用的,那么当设置了ThreadLocal的线程没有清除之前设置数据的话,就很可能造成之后复用线程的时候使用错误数据。所以,ThreadLocal类提供了一个解绑数据的方法Remove方法。
public void remove() {
ThreadLocalMap m = getMap(Thread.currentThread());
if (m != null) {
m.remove(this);
}
}
4 总结
ThreadLocal 方便编程时将数据绑定到当前线程上,而不用方法传递参数,只需在需要使用时从ThreadLocal获取数据即可。ThreadLocal中的ThreadLocalMap的KEY使用了弱引用,方便线程在长时间存活的情况下,及时清理GC只有弱引用的KEY值,一定程度上降低堆栈溢出的风险。但同时由于弱引用的使用,带来了线程泄露的风险,以及在数据库线程池场景下使用造成数据错误的风险。这就要求每个程序员在使用ThreadLocal结束后,及时使用remove方法(即使有些地方不remove也没有风险,但是写了就不会考虑这考虑那了,毕竟还有很多代码等着你)。