一、Class文件格式采用一种类似于C语言结构体的伪结构来存储数据,这种伪结构只有两种数据类型:无符号数和表。
-
无符号数
- 无符号数属于基本类型,以u1、u2、u4、u8来分表代表1个字节、2个字节、4个字节、8个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值或者按照UTF-8编码构成的字符串。
表
1.表是由多个无符号数或者其他表作为数据项构成的复合数据结构,所有表都习惯性地以_info结尾。表用于描述有层次关系的复合数据结构,整个class文件本质上就是一张表。
二、Class文件格式
三、各项说明
package com.lin.jvm;
public class TestClass {
private int m;
public int inc(){
return m + 1;
}
}
编译后生成TestClass.class文件。使用vim -b TestClass.class打开文件后,在vim的命令行状态下输入%!xxd,将二进制内容转换成十六进制内容。如下
1 00000000: cafe babe 0000 0031 0016 0a00 0400 1209 .......1........
2 00000010: 0003 0013 0700 1407 0015 0100 016d 0100 .............m..
3 00000020: 0149 0100 063c 696e 6974 3e01 0003 2829 .I...<init>...()
4 00000030: 5601 0004 436f 6465 0100 0f4c 696e 654e V...Code...LineN
5 00000040: 756d 6265 7254 6162 6c65 0100 124c 6f63 umberTable...Loc
6 00000050: 616c 5661 7269 6162 6c65 5461 626c 6501 alVariableTable.
7 00000060: 0004 7468 6973 0100 174c 636f 6d2f 6c69 ..this...Lcom/li
8 00000070: 6e2f 6a76 6d2f 5465 7374 436c 6173 733b n/jvm/TestClass;
9 00000080: 0100 0369 6e63 0100 0328 2949 0100 0a53 ...inc...()I...S
10 00000090: 6f75 7263 6546 696c 6501 000e 5465 7374 ourceFile...Test
11 000000a0: 436c 6173 732e 6a61 7661 0c00 0700 080c Class.java......
12 000000b0: 0005 0006 0100 1563 6f6d 2f6c 696e 2f6a .......com/lin/j
13 000000c0: 766d 2f54 6573 7443 6c61 7373 0100 106a vm/TestClass...j
14 000000d0: 6176 612f 6c61 6e67 2f4f 626a 6563 7400 ava/lang/Object.
15 000000e0: 2100 0300 0400 0000 0100 0200 0500 0600 !...............
16 000000f0: 0000 0200 0100 0700 0800 0100 0900 0000 ................
17 00000100: 2f00 0100 0100 0000 052a b700 01b1 0000 /........*......
18 00000110: 0002 000a 0000 0006 0001 0000 0003 000b ................
19 00000120: 0000 000c 0001 0000 0005 000c 000d 0000 ................
20 00000130: 0001 000e 000f 0001 0009 0000 0031 0002 .............1..
21 00000140: 0001 0000 0007 2ab4 0002 0460 ac00 0000 ......*....`....
22 00000150: 0200 0a00 0000 0600 0100 0000 0700 0b00 ................
23 00000160: 0000 0c00 0100 0000 0700 0c00 0d00 0000 ................
24 00000170: 0100 1000 0000 0200 11 .........
以上述的Class文件内容来说明表1的各项内容
1、第一项
u4 magic 1
第一项是魔数,共1个,2个字节。内容为十六进制的0xcafebabe
2、第二项
u2 minor_version 1
次版本号,2个字节,数量1。内容为十六进制的0x0000
3、第三项
u2 major_version 1
主版本号,2个字节 数量1 。内容为十六进制的0x0031
4、第四项
u2 constant_pool_constant 1
常量池中,常量的数量,十六进制内容为0x0016。转换成十进制就是22,由于这个容量计数从1开始。所有这个常量池中共有22-1.共21个常量。
5、第五项
cp_info constant_pool constant_pool_contant - 1
紧接着主次版本号之后的常量池入口,常量池可以理解为Class文件之中的资源仓库,它是Class文件结构中与其他项目关联最多的数据类型,也是占用Class文件空间最大的数据项目之一,同时它还是在Class文件中第一个出现的表类型数据项目。
常量池中主要存放两大类常量:字面量(Literal)和符号引用(Symbolic Reference),字面量比较接近于Java语言层面的常量概念。如文本字符串、声明为final的常量值等。而符号引用则属于编译原理方面的概念,包括了下面三类常量。
1. 类和接口的全限定名(Fully Qualified Name)
2. 字段的名称和描述符(Descriptor)
3. 方法的名称和描述符