int是我们常说的整形数字,是Java的8个原始数据类型之一。Java语言虽然号称一切都是对象,但是原始数据类型是一个例外。
Integer是int对应的包装类,它有一个int类型的字段存储数据,并且提供了基本操作,比如数学运算,int和字符串之间转换等。
/**
* The value of the {@code Integer}.
*
* @serial
*/
private final int value;
在Java 5中引入了自动装箱和自动拆箱功能,Java可以根据上下文,自动进行转换,极大地简化了相关编程。
关于Integer的值缓存,这涉及Java 5中的另一个改进。构建Integer对象的传统方式是直接调用构造器,直接new一个对象。但是根据时间,我们发现大部分数据操作都是集中在有限的、较小的数值范围,因而在Java 5中新增了静态工厂方法valueOf,在调用它的时候会利用一个缓存机制,带来了明显的性能改进。按照Javadoc,这个值默认缓存是-128到127之间。
/**
* Cache to support the object identity semantics of autoboxing for values between
* -128 and 127 (inclusive) as required by JLS.
*
* The cache is initialized on first usage. The size of the cache
* may be controlled by the {@code -XX:AutoBoxCacheMax=<size>} option.
* During VM initialization, java.lang.Integer.IntegerCache.high property
* may be set and saved in the private system properties in the
* sun.misc.VM class.
*/
注释表示Integer缓存支持对象的在-128至127之间的自动装箱语义的值。缓存在第一次使用的时候执行初始化,为什么是第一次使用的时候执行初始化呢?
因为
private static class IntegerCache {}
是在Integer类中的一个静态内部类,初始化外部类并不能导致初始化静态内部类,只要在第一次使用时才会初始化静态内部类。
缓存的最大值可以通过修改JVM参数来调整:
java.lang.Integer.IntegerCache.high
当VM初始化期间,这个缓存的最大值会作为私有系统属性设置和保存在sun.misc.VM class。
思考:
一、Java使用的不同阶段有:编译阶段、运行时等阶段,下面我们执行两行代码并将其进行反编译来分析Java中Integer的自动装箱和自动拆箱是在什么阶段执行的:
Integer integer = 1;
int unboxing = integer++;
上面两行代码反编译的结果为:
Integer integer = Integer.valueOf(1);
Integer localInteger1 = integer;
Integer localInteger2 = integer = Integer.valueOf(integer.intValue() + 1);
int unboxing = localInteger1.intValue();
通过反编译之后的结果我们可以看到Java中Integer的自动拆装箱是发生在编译阶段的。自动装箱实际上算是一种语法糖。也就是Java平台为我们自动进行了一些转换,保证不同的写法在运行时等价,他们发生在编译阶段,也就是生成的字节码是一致的。Integer拆箱装箱使用到的缓存机制同样存在与其他的一些包装类,比如:
Boolean:缓存了值true/false
Short:同样是缓存-128到127之间的数值,而且不能调整大小
Byte:数值有限,同样是缓存-128到127之间的数值,而且不能调整大小
Character:缓存范围’\u0000’ 到 ‘\u007F(0-127)
二、为什么一定需要使用原始类型int呢,int对应的包装类Integer使用更加方便,具体应用中会产生哪些差异呢?
原则上,建议避免无意中的装箱、拆箱行为,尤其是在性能敏感的场合,创建1000万个Java对象和1000万个整数的开销不是一个数量级的,不管是内存使用还是处理速度,光是对象头的空间占用就已经是数量级的差距了。
我们其实可以把这个观点扩展开,使用原始数据类型、数组甚至本地代码实现等,在性能极度敏感的场景下往往具有比较大的优势,用其替换掉包装类、动态数组(ArrayList)等可以作为性能优化的备选项。一些追求极致性能的产品或者类库会极力避免创建过多对象。当然在大多数产品代码里并没有必要这么做,还是需要优先保证开发效率。以我们经常会使用到的计数器实现为例,下面是一个常见的线程安全计数器实现:
class Counter {
private final AtomicLong counter = new AtomicLong();
public void increase() {
counter.incrementAndGet();
}
}
如果确实需要使用原始数据类型,可以将其修改为:
class CompactCounter {
private volatile long counter;
private static final AtomicIntegerFieldUpdater<CompactCounter> updater = AtomicIntegerFieldUpdater.newUpdater(CompactCounter.class, "counter");
public void increase() {
updater.incrementAndGet(this);
}
}
使用AtomicIntegerFieldUpdater可能又会带来反射等其他方面的性能开销,具体技术方案有的时候需要进行多次压力测试才能得到结果。
三、Java包装类里存储数值的成员变量"value"都被声明为"private final"。这种设计是可以理解的,或者说是必须的选择。比如Integer提供了getInteger()方法,用于方便地读取系统属性,我们可以用属性来设置服务器某个服务的端口,如果我们可以轻易地把获取到的Integer对象改变为其他数值,这样就会给产品可靠性方面带来严重的问题。
四、原始数据类型的变量显然要使用并发相关手段才能保证线程安全,而且原始数据类型和Java泛型并不能配合使用。
五、Java对象的内存结构是什么样子的,如何计算或者获取某个Java对象的大小
在HotSpot虚拟机中,对象在内存中存储的布局可以分为3个区域:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)
HotSpot虚拟机的对象头包括两部分信息,第一部分用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向
线程ID、偏向时间戳等,这部分数据的长度在32位和64位的虚拟机(未开启压缩指针)中分别为32bit和64bit,官方称它为"Mark Word"。
对象头的另外一部分是类型指针,即对象指向它的类元数据的指针、虚拟机通过这个指针来确定这个对象时哪个类的实例。并不是所有的虚拟机实现都必须在对象数据上保留类型指针,换句话说,查找对象的元数据信息并不一定要经过对象本身。另外,如果对象是一个Java数组,那在对象中还必须有一块用于记录数组长度的数据,因为虚拟机可以通过普通Java对象的元数据信息确定Java对象的大小,但是从数组中的元数据中却无法确定数组的大小。
接下来的实例数据部分是对象真正存储的有效信息,也是在程序代码中所定义的各种类型的字段内容。无论是从父类继承下来的,还是在子类中定义的,都需要记录下来。
第三部分对其填充并不是必然存在的,也没有特别的含义,它仅仅是起着占位符的作用。由于HotSpot VM的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说,就是对象的大小必须是8字节的整数倍。
1、可以使用jol工具获取对象的大小
https://www.jianshu.com/p/5790d82e8e73
2、或者使用Java 堆Dump文件在MAT中查看对象的大小也是可以的