参考 《深入理解Java虚拟机 JVM高级特性与最佳实践》 6.3节
1.class类文件结构
- 任何class文件都对应唯一一个类或接口的定义信息,但是类或接口不一定定义在文件里,也可以通过类加载器直接生成
- class文件没有分隔符,完全根据规定来定义不同成分的分界线
- class文件采用大段模式放置多字节数据
2.魔数与class文件的版本
- 一个class文件进来的第一个成分是魔数,它的唯一作用是确定这个文件是否能被虚拟机接受
- 接下来是这个class文件对应的Java版本,高版本兼容低版本,低版本不兼容高版本
3.常量池
- 常量池的作用其实就跟Java程序里的常量池差不多,就是放置一些常数,固定字符串等等的资源,让别的地方来通过
#1
(表示引用第一个常量,以此类推)引用,而不是写死在需要的地方 - 常量池包括了其与成分所需要的所有资源,所以常量池占空间最大
- 常量池的索引值是从1开始的,剩下来的0是为了表达
不引用任何常量
- 常量池包含了两种常量
- 字面量:文本字符串
"abc"
;final值final int i = 1
- 符号引用:类和接口的全限定名
java.lang.Object
;字段的名称和描述符I
;方法的名称和描述符()V
- 字面量:文本字符串
4.访问标记
- 访问标记就是标记一下这个类或接口层次的访问信息,这个class是类还是接口,是否public,是否abstract,是否final,等等
5.类索引、父类索引与接口索引集合
- 就是类的名字,父类名字还有接口们的名字,这些名字到常量池里引用
- 除了Object类,都有父类索引,这个时候常量池的0索引就发挥作用了,因为Object类是没有父类索引的,但是又不能跳过这个标志位,所以这里使用0索引来表达没有父类的意思,如果0索引被使用了,那么将造成歧义
6.字段表集合
- 描述类或接口中的声明的变量,可以是实例变量或者类变量
- 访问标志(public,static,final,volatile,transient)使用位标志来识别,一个字节中1位表示true,0为false
- 字段类型和字段名称需要引用常量池里的值
- 全限定名、简单名称和描述符
- 全限定名:就是一个类的全称
java.lang.Object
- 简单名称:一个变量的名字或者一个方法名(不包含返回值和参数,就是一个名字)
-
描述符:用一种另外定义的方法来描述变量和方法,这种描述方法是完整的
具体定义方法参见6.3节
- 全限定名:就是一个类的全称
- 字段表中不会出现从父类中继承的字段,但有可能出现原本Java代码中不存在的字段,比如内部类中的外部类引用
7.方法表集合
- 方法里的代码放到了属性表里的Code属性中
- Java代码中,方法重载是靠不同的参数来识别的,返回值不同是不能重载的,不过在字节码中,因为方法的描述符中其实是有返回值信息的,所以如果有两个方法名字参数相同,返回值不同,也是可以合法共存于同一个class文件的,不过这个对Java来说其实没什么意义,要么就在其他JVM语言里去实现这个特性好了
8.属性表集合
- code属性=>方法表:
- code属性出现在方法表的属性集合中
- slot是虚拟机为局部变量分配内存所使用的最小单位,一个slot的大小为32位,byte、char、float、int、short、boolean和returnAddress等长度不超过32位的,占用一个slot,double和long占用两个slot
- 局部变量包括:方法参数,异常处理的参数,方法体重定义的局部变量
- LineNumberTable属性=>Code属性:
描述Java源码行号与字节码行号之间的对应关系,是属于辅助类的属性,方便程序员的,理论上没有也没事。如果没有的话,抛出异常的话就没有行号信息了,而且也无法按照源码行来设置断点。 - LocalVariableTable属性=>Code属性:
描述栈中局部变量表中的变量与Java源码中定义的变量之间的关系,这也不是运行时必须的属性,也是方便程序员的。如果没有的话,引用这个方法的人将失去所有的参数名称,比如说IDE生成方法的时候,生成的都是arg0,arg1...了 - SourceFile属性=>类文件:
class文件对应的Java文件名称 - ConstantValue属性=>字段表:
一个字段如果有这个属性,那么必须是static的,并且虚拟机会根据这个属性的值为其初始化为常量 - InnerClasses属性=>类文件:
如果一个类含有内部类,则内部类的信息放在这个属性中 - Signature属性=>类、方法表、字段表:
记录泛型信息