天天看点

Java垃圾回收机制-对象死亡判断

作者:我是小向同学

在深入理解java虚拟机中,有这么一段话,Java与c++之间有一堵由内存动态分配和垃圾收集技术所围成的高墙,墙外面的人想进去,墙里面的人却想出来。

所以对于Java虚拟机来说,垃圾回收需要完成的三件事情:

  1. 那些内存需要回收?
  2. 什么时候回收?
  3. 如何回收?

今天我们讨论第一个问题,哪些内存需要回收?Java coder都清楚在堆中存放着Java世界中几乎所有的对象实例,垃圾收集器在对堆进行回收前,第一件事情就是要确定这些对象之中哪些还“存活着”,哪些已经“死去”(“死去”即不可能再被任何途径使用的对象)了

1 引用计算法

即在对象中添加一个引用计算器,每当有一个地方引用它的时候,计数器值就加一;当引用失效时,计算器值就减一;任何时刻计数器为零的对象就是不可能再被使用的。

客观来说,引用计数法(Reference Counting)虽然占用了一下额外的内存空间来进行计数,但它的原理简单,判定效率也很高,在大多数情况下它都是一个不错的算法,但是在javal领域,至少主流的java虚拟机里面都没有选用引用计数法来管理内存,主要原因就是这个看似简单的算法有很多例外情况要考虑,必须要配合大量额外处理才能保证正确地工作,譬如单纯的引用计数法就很难解决对象之间相互循环引用的问题。下面举个简单例子来进行说明

代码清单 引用计数算法的缺陷
/**
 * testGC()方法执行后,objA和objB会不会被GC呢?
 * @author zzm
 */
public class ReferenceCountingGC {
 
    public Object instance = null;
 
    private static final int _1MB = 1024 * 1024;
 
    /**
     * 这个成员属性的唯一意义就是占点内存,以便能在GC日志中看清楚是否有回收过
     */
    private byte[] bigSize = new byte[2 * _1MB];
 
    public static void testGC() {
        ReferenceCountingGC objA = new ReferenceCountingGC();
        ReferenceCountingGC objB = new ReferenceCountingGC();
        objA.instance = objB;
        objB.instance = objA;
 
        objA = null;
        objB = null;
 
        // 假设在这行发生GC,objA和objB是否能被回收?
        System.gc();
    }
}           

运行结果表明虚拟机并没有因为这两个对象互相引用就放弃回收它们,这也从侧面说明了Java虚拟机并不是通过引用计数算法来判断对象是否存活的。(具体虚拟机如何表明的,感兴趣的可以自己使用jdk自带命令,进行验证)。

2 可达性分析算法

当前主流的商用程序语言(Java,C#等)内存管理系统,都是通过可达性分析(Reachability Analysis)算法来判定对象是否存活的。这个算法的基本思路就是通过一系列称为“GC Roots”的根对象作为起始点集,从这些节点开始,根据引用关系向下搜索,搜索过程所走过的路径称为“引用链”(Reference Chain),如果某个对象不可达时,则证明此对象是不可能再被使用的。

如下图, 对象object5,object6,object7虽然互有关联,但是它们到GC Roots是不可达的,因此它们将会被判定为可回收的对象。

Java垃圾回收机制-对象死亡判断

在Java技术体系里面,固定可作为GC Roots的对象包括以下几种:

  • 在虚拟机栈(栈帧中的本地变量表)中引用的对象,譬如当前正在运行的方法所使用的参数,局部变量,临时变量等。
  • 在方法区中类静态属性引用的对象,譬如Java类的引用类型静态变量。
  • 在方法区中常量引用的对象,譬如字符串常量池(String Table)里的引用。
  • 在本地方法栈中JNI(即平常是的Native方法)引用的对象。
  • Java虚拟机内部的引用,如基本数据类型对应的Class对象,以下常驻的异常对象(譬如NullPointException,OutOfMemortError)等,还有系统类加载器等
  • 所有被同步锁(Synchronized关键字)持有的对象。
  • 反映Java虚拟机内部情况的JMXBean,JVMTI中注册的回调,本地代码缓存等。

当然除了这些固定的GC Roots集合以外,还可以根据用户选择的垃圾回收器以及当前回收内存区域不同,还可以有其他对象“临时性”加入。

继续阅读