Java区别于C的一个重要特点是自动内存管理,让我们学习一下内存管理,看看JVM都完成了哪些事。
故事要从C程序的运行时内存布局说起,内存布局要先从内存分区说起。
C程序的虚拟内存空间被设计成四部分
- 文本区: 用于存放代码、常量
- 数据区:用于存放全局变量、静态变量
- 堆区:用于存放动态申请对象,比如malloc申请的内存空间
- 栈区:每次函数调用都会创建栈帧,用于存放参数、返回值、调用方代码行数以及函数内声明的局部变量
内存分区中文本区、数据区的大小在编译、链接之后就已经决定了,栈区的大小在运行时随着函数调用时栈帧的创建、销毁而动态变化,堆区的内存空间在运行时随着malloc和free的调用而动态变化。栈区的变化仅发生在栈顶,堆区的变化可能发生在要复杂一些,因为free的内存地址不像栈顶那样连续,不过这是malloc需要考虑的问题。作为C的使用者需要考虑的是确保malloc和free合理使用,否则就会出现著名的内存泄露问题,比如,当有malloc没有free时就会产生绝对内存泄露,或者在一定时间内过量malloc也会产生相对内存泄露。应对内存泄露的方法有很多,我见过创建私有堆的,这种方法是预先申请一大块内存,然后应用的内存申请都发生在私有堆,把malloc和free封装在私有堆的使用方法中,更进一步可以对私有堆的使用进行追踪。
JVM的出现使得堆区内存有了合理的管理人,因为Java的世界里不再直接操作内存,Java的使用者考虑的是类型、对象,对象在堆内存的管理是JVM要考虑的事。JVM刚推出时也正是自动内存管理的特点招安了一大批C和C++程序员。
JVM使用堆内存创建了Java运行时环境,这是一个新世界,JVM说了算。和C程序的内存布局一样,JVM创建的新世界里也需要一些布局。由于Java程序运行在JVM启动后创建的新世界里,所以Java程序的所需内存都在运行时动态创建,也就没必要像前面的C内存布局那样安排地址空间范围,JVM也确实是按照用途对内存进行了划分。
- 方法区。存储已加载的类、常量
- 堆区。存放对象实例,JVM的垃圾回收主要针对这部分区域。
- 栈区。函数调用前后创建、销毁栈帧,栈帧存放局部变量、函数参数、返回值。比较特殊的是,栈区是线程私有的。
- 其他。比如线程的程序计数器、本地方法栈等。
对上述内存区域的管理,在实现细节上各个JVM不尽相同,不过要解决的问题大同小异。JVM读取类定义并加载到方法区,当遇到new指令时在堆区找到空闲区域创建并初始化对象,对不再使用的对象进行垃圾回收,JVM的垃圾回收机制确保不出现内存泄露。内存管理的职责完全由JVM承担,与Java程序解耦, Java程序员的思考方法也从面向内存升级到面向对象。
垃圾回收最早是Lisp中提出的,具体实现方法也研究了很多年,有过很多尝试。JVM作为主流虚拟机,投入的资源最多,效果也是最好的。