本文主要内容:
堆的回顾
串行收集器
并行收集器
cms收集器
零、堆的回顾:
新生代中的98%对象都是“朝生夕死”的,所以并不需要按照1:1的比例来划分内存空间,而是将内存分为一块比较大的eden空间和两块较小的survivor空间,每次使用eden和其中一块survivor。当回收时,将eden和survivor中还存活着的对象一次性地复制到另外一块survivor空间上,最后清理掉eden和刚才用过的survivor空间。hotspot虚拟机默认eden和survivor的大小比例是8:1,也就是说,每次新生代中可用内存空间为整个新生代容量的90%(80%+10%),只有10%的空间会被浪费。
当然,98%的对象可回收只是一般场景下的数据,我们没有办法保证每次回收都只有不多于10%的对象存活,当survivor空间不够用时,需要依赖于老年代进行分配担保,所以大对象直接进入老年代。
堆的结构如下图所示:

垃圾收集器:
如果说收集算法时内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。
虽然我们在对各种收集器进行比较,但并非为了挑出一个最好的收集器。因为直到现在位置还没有最好的收集器出现,更加没有万能的收集器,所以我们选择的只是对具体应用最合适的收集器。
一、串行收集器:serial收集器
最古老,最稳定
简单而高效
可能会产生较长的停顿
-xx:+useserialgc
新生代、老年代都会使用串行回收
新生代复制算法
老年代标记-整理
总结:serial收集器对于运行在client模式下的虚拟机来说是一个很好的选择。
这个收集器是一个单线程的收集器,但它的单线程的意义并不仅仅说明它只会使用一个cpu或一条收集线程去完成垃圾收集工作,更重要的是在它进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束。收集器的运行过程如下图所示:
二、并行收集器:
1、parnew收集器:
parnew收集器其实就是serial收集器新生代的并行版本。
多线程,需要多核支持。
-xx:+useparnewgc
新生代并行
老年代串行
-xx:parallelgcthreads 限制线程数量
2、parallel scanvenge收集器:
类似parnew,但更加关注吞吐量
-xx:+useparallelgc 使用parallel scanvenge收集器:新生代并行,老年代串行
3、parallel old收集器:
parallel old收集器是parallel scanvenge收集器的老年代版本
-xx:+useparallelgc 使用parallel old收集器:新生代并行,老年代并行
如下图所示:
各种参数设置:
-xx:maxgcpausemills
最大停顿时间,单位毫秒
gc尽力保证回收时间不超过设定值
-xx:gctimeratio
0-100的取值范围
垃圾收集时间占总时间的比
默认99,即最大允许1%时间做gc
注:这两个参数是矛盾的。因为停顿时间和吞吐量不可能同时调优。我们一方买希望停顿时间少,另外一方面希望吞吐量高,其实这是矛盾的。因为:在gc的时候,垃圾回收的工作总量是不变的,如果将停顿时间减少,那频率就会提高;既然频率提高了,说明就会频繁的进行gc,那吞吐量就会减少,性能就会降低。
吞吐量:cpu用于用户代码的时间/cpu总消耗时间的比值,即=运行用户代码的时间/(运行用户代码时间+垃圾收集时间)。比如,虚拟机总共运行了100分钟,其中垃圾收集花掉1分钟,那吞吐量就是99%。
注2:以上所有的收集器当中,当执行gc时,都会stop the world,但是下面的cms收集器却不会这样。
三、cms收集器:
cms收集器(concurrent mark sweep:并发标记清除)是一种以获取最短回收停顿时间为目标的收集器。适合应用在互联网站或者b/s系统的服务器上,这类应用尤其重视服务器的响应速度,希望系统停顿时间最短。
concurrent mark sweep 并发标记清除,并发低停顿
标记-清除算法
并发阶段会降低吞吐量(因为停顿时间减少了,于是gc的频率会变高)
老年代收集器(新生代使用parnew)
-xx:+useconcmarksweepgc 打开这收集器
注:这里的并发指的是与用户线程一起执行。
2、cms收集器运行过程:(着重实现了标记的过程)
(1)初始标记
根可以直接关联到的对象
速度快
(2)并发标记(和用户线程一起)
主要标记过程,标记全部对象
(3)重新标记
由于并发标记时,用户线程依然运行,因此在正式清理前,再做修正
(4)并发清除(和用户线程一起)
基于标记结果,直接清理对象
整个过程如下图所示:
其中,初始标记和重新标记时,需要stop the world。
整个过程中耗时最长的是并发标记和并发清除,这两个过程都可以和用户线程一起工作。
打印gc日志举例如下:
3、cms收集器特点:
(1)尽可能降低停顿
(2)会影响系统整体吞吐量和性能
比如,在用户线程运行过程中,分一半cpu去做gc,系统性能在gc阶段,反应速度就下降一半
(3)清理不彻底
因为在清理阶段,用户线程还在运行,会产生新的垃圾,无法清理
(4)因为和用户线程一起运行,不能在空间快满时再清理
-xx:cmsinitiatingoccupancyfraction设置触发gc的阈值
如果不幸内存预留空间不够,就会引起concurrent mode failure
我们来看一下concurrent mode failure的日志:
碰到上图中的情况,我们需要使用串行收集器作为后备。
4、既然标记清除算法会造成内存空间的碎片化,cms收集器为什么使用标记清除算法而不是使用标记整理算法:
答案:
cms收集器更加关注停顿,它在做gc的时候是和用户线程一起工作的(并发执行),如果使用标记整理算法的话,那么在清理的时候就会去移动可用对象的内存空间,那么应用程序的线程就很有可能找不到应用对象在哪里。
为了解决碎片的问题,cms收集器会有一些整理上的参数,接下来就来讲这个。
5、整理时的各种参数:
-xx:+ usecmscompactatfullcollection
full gc后,进行一次整理。整理过程是独占的,会引起停顿时间变长
-xx:+cmsfullgcsbeforecompaction
设置进行几次full gc后,进行一次碎片整理
-xx:parallelcmsthreads
设定cms的线程数量
四、gc参数的整理:
-xx:+useserialgc:在新生代和老年代使用串行收集器
-xx:survivorratio:设置eden区大小和survivior区大小的比例
-xx:newratio:新生代和老年代的比
-xx:+useparnewgc:在新生代使用并行收集器
-xx:+useparallelgc :新生代使用并行回收收集器
-xx:+useparalleloldgc:老年代使用并行回收收集器
-xx:parallelgcthreads:设置用于垃圾回收的线程数
-xx:+useconcmarksweepgc:新生代使用并行收集器,老年代使用cms+串行收集器
-xx:parallelcmsthreads:设定cms的线程数量
-xx:cmsinitiatingoccupancyfraction:设置cms收集器在老年代空间被使用多少后触发
-xx:+usecmscompactatfullcollection:设置cms收集器在完成垃圾收集后是否要进行一次内存碎片的整理
-xx:cmsfullgcsbeforecompaction:设定进行多少次cms垃圾回收后,进行一次内存压缩
-xx:+cmsclassunloadingenabled:允许对类元数据进行回收
-xx:cmsinitiatingpermoccupancyfraction:当永久区占用率达到这一百分比时,启动cms回收
-xx:usecmsinitiatingoccupancyonly:表示只在到达阀值的时候,才进行cms回收
最后的总结:
为了减轻gc压力,我们需要注意些什么?
软件如何设计架构(性能的根本在应用)
gc参数属于微调(设置不合理会影响性能,产生大的延时)
堆空间如何管理和分配
代码如何写