一个进程对应一个运行时数据区,一个进程又存在多个线程,方法区和堆区是线程共享的,虚拟机栈、本地方法栈、程序计数器是线程私有的。
PC计数器
PC寄存器,用来存储虚拟机字节码指令的地址 ,即当前线程将要指行的字节码行号指示器(下一条指令的地址)。字节码解释器通过改变PC寄存器来得到下一条执行的字节码指令;
CPU会不断切换各个线程,切换回来后需要知道从哪里继续执行
虚拟机栈
描述方法执行的线程内存模型。
每个线程的创建都会创建一个栈,线程私有。
每个方法执行时,都会创建一个栈帧,用于存储局部变量表、操作数栈、动态链接信息、返回地址信息、附加信息。每个方法被调用执行到执行完毕,对应着栈帧的入栈和出栈。
栈的操作只有入栈和出栈(对应方法的调用返回)
不存在垃圾回收
虚拟机栈中可能存在的异常
JVM虚拟机规范是允许虚拟机栈的大小是固定的或者动态的。
- 如果固定,可能出现StackOverflowError
- 如果不固定,当申请不到足够的内存时会出现OOM
栈的大小直接决定了方法的深度,可以通过-Xss 来设置栈的大小(-Xss设置每个线程栈的大小)
栈的运行原理
局部变量表
- 局部变量表是一组变量值的存储空间。
- 是一个数字数组,用于存储方法参数和方法内部定义局部变量的值。包括基本类型、对象引用、returnAddress类型。
- 局部变量表的大小是在编译时确定的,在方法的Code属性“max_locals数据项中存储了局部变量表的最大容量
- 栈帧的大小主要就是局部变量表
局部变量槽
- 局部变量存储的基本单位是变量槽
- 32位以内的类型占一个槽(包括returnAddress)
long和double类型的占2个槽 - 当方法调用时按照声明的顺序复制到局部变量表中。
- 如果当前栈帧是构造方法或实例方法(非static),则索引的第一个槽放的是this,代表该对象的引用。
局部变量槽是可以复用的,如果PC计数器的值已经超过了当前变量的作用域,那这个变量对应的槽可能被后面定义的变量复用。比如下图中的变量c,和变量b的局部变量索引都是2
变量的分类(是否赋默认值)
局部变量表的对象引用也是重要的垃圾回收根节点,只有不被局部变量表直接或间接引用的对象才会被垃圾回收。
局部变量表在方法调用的时候创建,在方法调用结束,随着栈帧的销毁而销毁。
操作数栈
- 操作数栈用来保存计算的中间结果
- 先进后出,通过数组保存,和局部变量表类似,栈的最大深度在编译时就确定,并存入Code属性的max_stack中;并且栈中存储的单元大小32位,long和double类型的占2个栈深度。
- 操作数栈的存储结构也是数组,但是不是通过索引访问,只能栈顶进行入栈和出栈。
当方法执行的时候,栈帧被创建出来,但是栈帧是空的(数组被创建,长度已经确定)
局表变量表+操作数栈举例 局表变量表+操作数栈举例
动态链接
在运行期间,将符号引用转化为直接引用的过程;编译之后,方法的调用指向常量池的某个值,运行时将厂里池的符号引用转化为直接引用。
非虚方法:
在编译期就可以确定的方法(即方法不会改变)就叫非虚方法。
- static方法、私有方法、父类方法、final方法、实例构造器都属于非虚方法。
- 其他的属于虚方法
虚方法,实现多态:类的继承关系、方法重写(运行时调用子类或实现类)
方法调用的指令:
- invokestatic:调用静态方法
- invokespecial:调用<init>方法、父类方法、私有方法
- invokevirtual:调用虚方法(final方法也是这个命令,但属于非虚方法)
- invokerinterface:调用接口方法
- invokedynamic:动态解析调用方法执行,Lambda表达式就是,运行时才知道具体的方法实现是啥(对象都是动态的,类似动态语言,变量的值编译时不知道)
分派
看代码:
package com.demo.jvm;
public class HumanTest {
static abstract class Human {
}
static class Man extends Human {
}
static class Woman extends Human {
}
public void sayHello(Human human) {
System.out.println("Human");
}
public void sayHello(Man human) {
System.out.println("Man");
}
public void sayHello(Woman human) {
System.out.println("Woman");
}
public static void main(String[] args) {
HumanTest humanTest = new HumanTest();
Human man = new Man();
Human woman = new Woman();
humanTest.sayHello(man);
humanTest.sayHello(woman);
humanTest.sayHello((Man) man);
}
}
其中
Human man = new Man();
中的Human
成为静态类型,Man
称为实际类型
静态分派:依赖静态类型来决定方法执行版本成为静态变量,上述代码中,humanTest.sayHello(man);humanTest.sayHello(woman);
的执行结果都是Human
,这是因为编译期通过静态分派确定重载的执行方法。根据类型确定的。
动态分派:运行时才知道实际类型是哪个,实现原理主要是invokevirtual指令。
从指令调用过程可以看出,调用的时候是对象的实际类型开始查找,如果找到就直接return。实现重写。
上面的动态分派实现时需要不断向上搜索,得到具体执行的目标方法,比较耗性能,因此通过虚方法表和接口方法表进行缓存。
方法的返回地址
正常情况下存放主调方的PC寄存器的值
存放调用该方法的PC寄存器的值:调用完方法之后可以继续往下执行
方法执行结束后:相当于栈顶出栈,出栈后,恢复调用方的局部变量表和操作数栈,并把方法的返回结果压入操作数栈的栈顶,PC寄存器执行方法调用的下一条指令。
相关面试题:
1、虚拟机栈涉及垃圾回收吗?
答:不涉及,出栈相当于就回收了,但是局部变量表会影响垃圾回收,如果局部变量表还持有对象的引用,就不能被回收。
2、分配的栈内存越大越好吗?
不是,增大栈并不能避免栈溢出,只是延迟。
每个线程都会分配栈,如果一个栈内存变大,总内存不变的情况下,可建的线程数变少(挤压其他线程的栈空间)
3、方法中定义的局部变量是否线程安全:
不一定。如果是内部产生,内部消亡的,那就是线程安全的,如果不是,则可能存在线程安全问题(形参是个对象,方法返回对象被其他调用)