垃圾回收(GC) 详解

本章节讲述垃圾回收机制。

一.简介

垃圾回收或GC（Garbage Collection），是一种自动的存储管理机制，它是Java语言的一大特性，方便了我们这些程序员编码，把内存释放工作的压力都转让到了系统，故而是以消耗系统性能为代价的。

C++编码的时候，我们需要自己实现析构函数来进行内存释放，很麻烦，而且非常容易遗漏而最终导致程序崩掉。所以Java语言就引入了自动内存管理的机制，也就是垃圾回收机制。

二.回收算法

其实，GC主要的一个流程是：先根据一定的算法判定某个对象是否存活，然后把判定是垃圾的对象进行回收。详细点说的话，GC的工作流程分以下几个步骤：

(1) 可回收对象的判定。

(2) 通过某些算法回收垃圾内存。

<1> 可回收对象的判定

我们的GC需要把某个对象回收掉，肯定是需要判断它到底是不是垃圾，是不是需要被回收，因此，就需要对每一个对象进行可回收判定。

目前，市面上存在有两种算法来判定一个对象是否是垃圾。

(1) 引用计数算法

这种算法的工作原理是:

[1] 首先给每一个对象都添加一个引用计数器。

[2] 当程序的某一个地方引用了此对象，这个计数器的值就加1。

[3] 当引用失效的时候（例如超过了作用域），这个计数器就减1。

[4] 当某一个对象的计数器的值是0的时候，则判定这个对象不可能被使用。

这种算法对于系统来说比较简单，高效，垃圾回收器运行较快，不需要长时间中断我们的程序的执行，但是缺点是很难处理循环引用，这就导致相互引用的对象都无法被回收

垃圾回收(GC) 详解

(2) Root可达性分析算法

这个算法的工作原理是：

[1] 以称作“GC Root”的对象作为起点向下搜索。

[2] 每走过一个对象，就生成一条引用链。

[3] 从根开始到搜索完，生成了一棵引用树，那些到GC Root不可达的对象就是可以回收的。

这个方法明显就解决了循环引用的问题，不过这个算法还是稍微有点复杂的,以下是GC Root可达性算法的一个图解

垃圾回收(GC) 详解

我们程序中能够被用来当做GC Root对象的有

[1] 虚拟机栈（栈帧中的本地变量表）中引用的对象。

[2] 方法区中静态属性引用的对象。

[3] 方法区中常量引用的对象。

[4] 本地方法栈中JNI引用的对象。

以下拿一个图来进行引用计数算法与可达性分析算法的比较

垃圾回收(GC) 详解

文字说明

[1] 若使用引用计数算法判定，但图中的C和D对象存在相互引用，导致计数器不为0，无法回收掉。

[2] 若使用可达性分析算法，C和D对象到GC Roots 不可达，则能够回收。

关于对象可回收的判定，我们还需要注意的是，当系统开始启动GC的时候，为了保证引用链的状态不变，就需要停止该进程中所有的程序（Stop The World），我们Android中的现象就是UI卡顿了，但一般这样的卡顿时间是非常短的，当然，要是频繁的产生GC，那就另当别论了。

还有值得注意的是，不可达对象也并非立即就被回收了，还需要经过两次的标记过程后才被会被真正回收

[1] 如果对象与GC Root没有连接的引用链，就会被第一次标记，随后判定该对象是否有必要执行finalize()方法。

[2] 如果有必要执行finalize()方法，则这个对象就会被放到F-Queue的队列中，稍后由虚拟机建立低优先级的Finalizer线程去执行，但并不承诺等待它运行结束（对象类中能够重写finalize()方法进行自救，但系统最多只能执行一次）。

[3] 如果没必要执行finalize()方法，则第二次标记。

<2> 通过某些算法回收垃圾内存

以上内容讲述了系统如何去判定某一个对象是否是垃圾，是否应该被回收。接着，当判定了某一个对象为垃圾对象后，系统就要开始进行回收了，那么系统的垃圾回收算法以下几种

[1] 标记清除算法(Mark-Sweep)。

[2] 复制算法(Copying)。

[3] 标记整理算法(Mark-Compact)。

[4] 分代回收算法。

(1) 标记清除算法(Mark-Sweep)

顾名思义，这个算法是先进行标记，然后进行清除，也正是这个算法的两个阶段：标记阶段和清除阶段，以下图解

垃圾回收(GC) 详解

从图中可以看出

这个算法的优点是易于理解，容易实现，只需要将特定地址的空间进行处理。但缺点也比较明显，把整个内存区域弄得非常不完整，形成了很多碎片化的内存，对于分配大内存的对象时，无法申请足够的空间，从而更多次的触发GC。

(2) 复制算法(Copying)

复制算法，是对标记清除算法而导致内存碎片化的一个解决方案，算法原理如下

垃圾回收(GC) 详解

[1] 如图所示,复制算法将内存平均分成两个区域A （上）和 B（下）。

[2] 将A中的存活的那些对象复制到B区域中。

[3] 然后将A区域的所有对象都清除，这样A区域就是一个完整的内存块了，也就避免了内

存碎片化了。

但是这个算法也有明显的缺点，那就是不管A区域或B区域有多少个存活对象，都需要将整块内存分成两个区域，意味着能够真正使用的内存变成了一半。

(3) 标记整理算法(Mark-Compact)

标记整理算法是对于标记清楚的一个优化，工作原理是

垃圾回收(GC) 详解

[1] 如图所示，第一步也需要进行存活对象的一个标记，这一步与标记清除算法一模一样。

[2] 将存活的对象向一端移动，例如图中是往左上角那一端进行移动。

[3] 然后把另一端的内存进行清理。

从图中也可以看出，这个算法也能避免内存碎片化的问题，但是效率确实不怎么样，毕竟相较于复制算法，多了一步效率同样比较低的标记过程，而与标记清除算法相比，多了一步内存整理（往一端移动）的过程，效率上明显就更低了。

毕竟世界是公平的，任何算法都有两面性，我们开发者只能具体情况具体分析，使用最适合的算法。因此标记整理算法从图中可以看出，这个算法适合存活对象多的，回收对象少的情况。

(4) 分代回收算法

鉴于以上三种算法都存在自己的缺陷，然后大神们就提出了根据不同对象的不同特性，使用不同的算法进行处理，所以严格来讲并不是一个新的算法，而是属于一种算法整合方案，我们知道

[1] 复制算法适用于存活对象少，回收对象多的情况。

[2] 标记整理算法适用于存活对象多，回收对象少的情况。

这两种算法刚好互补，因此只要将这两个算法作用于不同特性的对象，就完美了。。

那么我们就应该知道，哪个区域的对象是什么样的特性，根据我的上一篇的内存分配模型，堆内存中的新生代有很多的垃圾需要回收，老年代有很少的垃圾需要回收，那么刚好能够根据这个特点使用不同的算法进行回收，具体使用的方式为：

[1] 对于新生代区域采用复制算法，因为新生代中每次垃圾回收都要回收大部分对象，那么也就意味着复制次数比较少，因此采用复制算法更高效。

[2] 而老年代区域的特点是每次回收都只能回收很少的对象，一般使用的是标记整理或者标记清除算法。

通过以上的方式，使得GC的整个过程达到了最高效的状态。这里需要注意的是分代回收算法的中的复制算法的使用。之前说的复制算法是将内存均分为二，但是在分代回收中，并不是这样，而是根据Eden:Survivor A:Survivor B= 8:1:1,具体的过程是(简化版)：

[1] 新创建一个对象，默认是分在Eden区域，当Eden区域内存不够的时候，会触发一次Min or GC(新生代回收)，这次回收将存活的对象放到Survivor A区域，然后新的对象继续放在Eden区域。

[2] 再创建一个新的对象，要是Eden区域又不够了，再次触发Minor GC，这个时候会把Eden区域的存活对象以及

Survivor A区域的存活的对象移动到Survivor B区域，然后清空Eden区域以及Survivor A区域。

[3] 如果继续有新的对象创建，不断触发Minor GC，有些对象就会不断在Survivor A区域以及Survivor B区域来回移动，但移动次数超过15次后，这些对象就会被移动到老年代区域。

[4] 如果新的对象在Minor GC后还是放不下，就直接放到老年代。

[5] 如果Survivor区域放不下该对象，这直接放到老年代。

[6] 如果老年代也满了，就会触发一次Full GC(major gc)。

垃圾回收(GC) 详解

一.简介

二.回收算法

继续阅读

硬盘格式化了以后数据就不可以找回了吗？（转载）

Windows右键菜单中加入用notepad++打开选项

powershell生成svn日志（word）

终端服务器超出最大允许连接数的解决办法

argument和parameter的区别

Linux监控重要进程的实现方法

svn常用操作–windows

黑马程序员_this和static关键字

打包的时候让.net framework1.1自动安装

JVM知识详解

TOP K问题的解决方案1.类选择排序法2.快速排序法3.堆排序法4. 方法比较

QQ邮箱可以绑定自己的域名拉

垃圾回收机制的工作原理

深拷贝与浅拷贝(Deep Copy and Shallow Copy)

科普：alphago是什么

如何选择合理的域名如何选择合理的域名