Java在诞生时就以一次编写,到处运行特点在各个平台都可以进行运行。其实就是通过不同的编译器(Javac编译器,jrubyc编译器,groovyc编译器等等)将代码编译成规范的class文件,虚拟机只要接收到claas文件而并不关心是class文件时哪一种编译器编译的,这样就到达了(write one,run anywhere)。所以要想更好的了解虚拟机,下面我们走进class文件中!!
Class文件是一组以8bit为基础单位的二进制流,各个数据项目严格按顺序紧凑地排列在class文件中,中间无任何添割符。Class文件格式采用一种类似于C语言结构体的伪结构来储存数据,这种伪结构只有两种数据:无符号数和表。
无符号数属于基本的数据类型,以u1,u2,u3,u4,u8表示1个字节,2个字节,3个字节,4个字节,8个字节,无符号数可以用来描述数字,索引引用,数量值或者按照UTF-8编码构成字符串。
表是由多个无符号数或者其它表作为数据项构成的复合数据类型,所有表都习惯地以"_info"结尾。表用于描述由层次关系的复合结构的数据,整个class文件本质上就是一张表。
class文件格式
类型 | 名称 | 数量 |
---|---|---|
u4 | magic(魔数) | 1 |
u2 | minor_version(JDK次版本号) | 1 |
u2 | major_version(JDK主版本号) | 1 |
u2 | constant_pool_count(常量池数量) | 1 |
cp_info | constan_pool(常量表) | constant_pool_count-1 |
u2 | access_flags(访问标志) | 1 |
u2 | this_class(类引用) | 1 |
u2 | super_class(父类引用) | 1 |
u2 | interfaces_count(接口数量) | 1 |
u2 | interfaces(接口数组) | interfaces_count |
u2 | fields_count(字段数量) | 1 |
field_info | fields(属性表) | fields_count |
u2 | methods_count(方法数量) | 1 |
method_info | methods(方法表) | methods_count |
u2 | attributes_count(属性数量) | 1 |
attribute_info | attributes(属性表) | attributes_count |
由于方便,先讲概念,最后翻译一个class文件的形式进行讲解
一:魔数:每个class文件的头4个字节称为魔数,它的唯一作用就是确定这个文件是否为一个能被虚拟机接收的class文件。值为CAFEBABE,紧接着就是4个字节的版本号,其中前两个为次版本号,后两个为主版本号。到目前前8个字节就确定了。
二:版本号:一个4个字节,前两字节表示次版本号,后两字节表示主版本号。
三:常量池:紧接着主次版本号就是常量池了,第一个是常量池数量(占两个字节),接下来就是常量池表,我以表的方式展现。
常量池表结构
类型 | 名称 | 数量 |
---|---|---|
u1 | tag(常量池的项目类型号) | 1 |
u2 | name_index(索引) | 1 |
那么tag对应的就是常量池的项目类型,下面我们来看看有哪些
读取常量池的时候首先读取标志位,判断常量类型,就可以知道对应的结构,获取对应的信息了。
下面我们来一个简单的代码,并编译成class文件,以二进制形式打开,人为来解析一下。
Java代码
public class Test{
}
class文件
使用javap指令反编译
C:\Users\GH\Desktop>javap -verbose Test.class
Classfile /C:/Users/GH/Desktop/Test.class
Last modified 2018-8-8; size 182 bytes
MD5 checksum f22f52551c287057ed6d62d392d5647e
Compiled from "Test.java"
public class Test
minor version: 0
major version: 52
flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
#1 = Methodref #3.#10 // java/lang/Object."<init>":()V
#2 = Class #11 // Test
#3 = Class #12 // java/lang/Object
#4 = Utf8 <init>
#5 = Utf8 ()V
#6 = Utf8 Code
#7 = Utf8 LineNumberTable
#8 = Utf8 SourceFile
#9 = Utf8 Test.java
#10 = NameAndType #4:#5 // "<init>":()V
#11 = Utf8 Test
#12 = Utf8 java/lang/Object
{
public Test();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=1, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
LineNumberTable:
line 1: 0
}
SourceFile: "Test.java"
参考:
https://blog.csdn.net/weixin_40234548/article/details/81507125