一、JVM内存模型及垃圾收集算法
1.根据Java虚拟机规范,JVM将内存划分为:
- New(年轻代)
- Tenured(年老代)
- 永久代(Perm)
其中New和Tenured属于堆内存,堆内存会从JVM启动参数(-Xmx:3G)指定的内存中分配,Perm不属于堆内存,有虚拟机直接分配,但可以通过-XX:PermSize -XX:MaxPermSize 等参数调整其大小。
- 年轻代(New):年轻代用来存放JVM刚分配的Java对象
- 年老代(Tenured):年轻代中经过垃圾回收没有回收掉的对象将被Copy到年老代
- 永久代(Perm):永久代存放Class、Method元信息,其大小跟项目的规模、类、方法的量有关,一般设置为128M就足够,设置原则是预留30%的空间。
New又分为几个部分:
- Eden:Eden用来存放JVM刚分配的对象
- Survivor1
- Survivro2:两个Survivor空间一样大,当Eden中的对象经过垃圾回收没有被回收掉时,会在两个Survivor之间来回Copy,当满足某个条件,比如Copy次数,就会被Copy到Tenured。显然,Survivor只是增加了对象在年轻代中的逗留时间,增加了被垃圾回收的可能性。
2.垃圾回收算法
垃圾回收算法可以分为三类,都基于标记-清除(复制)算法:
- Serial算法(单线程)
- 并行算法
- 并发算法
JVM会根据机器的硬件配置对每个内存代选择适合的回收算法,比如,如果机器多于1个核,会对年轻代选择并行算法,关于选择细节请参考JVM调优文档。
稍微解释下的是,并行算法是用多线程进行垃圾回收,回收期间会暂停程序的执行,而并发算法,也是多线程回收,但期间不停止应用执行。所以,并发算法适用于交互性高的一些程序。经过观察,并发算法会减少年轻代的大小,其实就是使用了一个大的年老代,这反过来跟并行算法相比吞吐量相对较低。
还有一个问题是,垃圾回收动作何时执行?
- 当年轻代内存满时,会引发一次普通GC,该GC仅回收年轻代。需要强调的时,年轻代满是指Eden代满,Survivor满不会引发GC
- 当年老代满时会引发Full GC,Full GC将会同时回收年轻代、年老代
- 当永久代满时也会引发Full GC,会导致Class、Method元信息的卸载
另一个问题是,何时会抛出OutOfMemoryException,并不是内存被耗空的时候才抛出
- JVM98%的时间都花费在内存回收
- 每次回收的内存小于2%
满足这两个条件将触发OutOfMemoryException,这将会留给系统一个微小的间隙以做一些Down之前的操作,比如手动打印Heap Dump。
二、内存泄漏及解决方法
1.系统崩溃前的一些现象:
- 每次垃圾回收的时间越来越长,由之前的10ms延长到50ms左右,FullGC的时间也有之前的0.5s延长到4、5s
- FullGC的次数越来越多,最频繁时隔不到1分钟就进行一次FullGC
- 年老代的内存越来越大并且每次FullGC后年老代没有内存被释放
之后系统会无法响应新的请求,逐渐到达OutOfMemoryError的临界值。
2.生成堆的dump文件
通过JMX的MBean生成当前的Heap信息,大小为一个3G(整个堆的大小)的hprof文件,如果没有启动JMX可以通过Java的jmap命令来生成该文件。
3.分析dump文件
下面要考虑的是如何打开这个3G的堆信息文件,显然一般的Window系统没有这么大的内存,必须借助高配置的Linux。当然我们可以借助X-Window把Linux上的图形导入到Window。我们考虑用下面几种工具打开该文件:
- Visual VM
- IBM HeapAnalyzer
- JDK 自带的Hprof工具
使用这些工具时为了确保加载速度,建议设置最大内存为6G。使用后发现,这些工具都无法直观地观察到内存泄漏,Visual VM虽能观察到对象大小,但看不到调用堆栈;HeapAnalyzer虽然能看到调用堆栈,却无法正确打开一个3G的文件。因此,我们又选用了Eclipse专门的静态内存分析工具:Mat。
4.分析内存泄漏
通过Mat我们能清楚地看到,哪些对象被怀疑为内存泄漏,哪些对象占的空间最大及对象的调用关系。针对本案,在ThreadLocal中有很多的JbpmContext实例,经过调查是JBPM的Context没有关闭所致。
另,通过Mat或JMX我们还可以分析线程状态,可以观察到线程被阻塞在哪个对象上,从而判断系统的瓶颈。
5.回归问题
Q:为什么崩溃前垃圾回收的时间越来越长?
A:根据内存模型和垃圾回收算法,垃圾回收分两部分:内存标记、清除(复制),标记部分只要内存大小固定时间是不变的,变的是复制部分,因为每次垃圾回收都有一些回收不掉的内存,所以增加了复制量,导致时间延长。所以,垃圾回收的时间也可以作为判断内存泄漏的依据
Q:为什么Full GC的次数越来越多?
A:因此内存的积累,逐渐耗尽了年老代的内存,导致新对象分配没有更多的空间,从而导致频繁的垃圾回收
Q:为什么年老代占用的内存越来越大?
A:因为年轻代的内存无法被回收,越来越多地被Copy到年老代
三、性能调优
除了上述内存泄漏外,我们还发现CPU长期不足3%,系统吞吐量不够,针对8core×16G、64bit的Linux服务器来说,是严重的资源浪费。
在CPU负载不足的同时,偶尔会有用户反映请求的时间过长,我们意识到必须对程序及JVM进行调优。从以下几个方面进行:
- 线程池:解决用户响应时间长的问题
- 连接池
- JVM启动参数:调整各代的内存比例和垃圾回收算法,提高吞吐量
- 程序算法:改进程序逻辑算法提高性能
1.Java线程池(java.util.concurrent.ThreadPoolExecutor)
大多数JVM6上的应用采用的线程池都是JDK自带的线程池,之所以把成熟的Java线程池进行罗嗦说明,是因为该线程池的行为与我们想象的有点出入。Java线程池有几个重要的配置参数:
- corePoolSize:核心线程数(最新线程数)
- maximumPoolSize:最大线程数,超过这个数量的任务会被拒绝,用户可以通过RejectedExecutionHandler接口自定义处理方式
- keepAliveTime:线程保持活动的时间
- workQueue:工作队列,存放执行的任务
Java线程池需要传入一个Queue参数(workQueue)用来存放执行的任务,而对Queue的不同选择,线程池有完全不同的行为:
- SynchronousQueue: 一个无容量的等待队列,一个线程的insert操作必须等待另一线程的remove操作,采用这个Queue线程池将会为每个任务分配一个新线程
- LinkedBlockingQueue : 无界队列,采用该Queue,线程池将忽略 maximumPoolSize参数,仅用corePoolSize的线程处理所有的任务,未处理的任务便在LinkedBlockingQueue中排队
- ArrayBlockingQueue: 有界队列,在有界队列和 maximumPoolSize的作用下,程序将很难被调优:更大的Queue和小的maximumPoolSize将导致CPU的低负载;小的Queue和大的池,Queue就没起动应有的作用。
其实我们的要求很简单,希望线程池能跟连接池一样,能设置最小线程数、最大线程数,当最小数<任务<最大数时,应该分配新的线程处理;当任务>最大数时,应该等待有空闲线程再处理该任务。
但线程池的设计思路是,任务应该放到Queue中,当Queue放不下时再考虑用新线程处理,如果Queue满且无法派生新线程,就拒绝该任务。设计导致“先放等执行”、“放不下再执行”、“拒绝不等待”。所以,根据不同的Queue参数,要提高吞吐量不能一味地增大maximumPoolSize。
当然,要达到我们的目标,必须对线程池进行一定的封装,幸运的是ThreadPoolExecutor中留了足够的自定义接口以帮助我们达到目标。我们封装的方式是:
- 以SynchronousQueue作为参数,使maximumPoolSize发挥作用,以防止线程被无限制的分配,同时可以通过提高maximumPoolSize来提高系统吞吐量
- 自定义一个RejectedExecutionHandler,当线程数超过maximumPoolSize时进行处理,处理方式为隔一段时间检查线程池是否可以执行新Task,如果可以把拒绝的Task重新放入到线程池,检查的时间依赖keepAliveTime的大小。
2.连接池(org.apache.commons.dbcp.BasicDataSource)
在使用org.apache.commons.dbcp.BasicDataSource的时候,因为之前采用了默认配置,所以当访问量大时,通过JMX观察到很多Tomcat线程都阻塞在BasicDataSource使用的Apache ObjectPool的锁上,直接原因当时是因为BasicDataSource连接池的最大连接数设置的太小,默认的BasicDataSource配置,仅使用8个最大连接。
我还观察到一个问题,当较长的时间不访问系统,比如2天,DB上的Mysql会断掉所以的连接,导致连接池中缓存的连接不能用。为了解决这些问题,我们充分研究了BasicDataSource,发现了一些优化的点:
- Mysql默认支持100个链接,所以每个连接池的配置要根据集群中的机器数进行,如有2台服务器,可每个设置为60
- initialSize:参数是一直打开的连接数
- minEvictableIdleTimeMillis:该参数设置每个连接的空闲时间,超过这个时间连接将被关闭
- timeBetweenEvictionRunsMillis:后台线程的运行周期,用来检测过期连接
- maxActive:最大能分配的连接数
- maxIdle:最大空闲数,当连接使用完毕后发现连接数大于maxIdle,连接将被直接关闭。只有initialSize < x < maxIdle的连接将被定期检测是否超期。这个参数主要用来在峰值访问时提高吞吐量。
- initialSize是如何保持的?经过研究代码发现,BasicDataSource会关闭所有超期的连接,然后再打开initialSize数量的连接,这个特性与minEvictableIdleTimeMillis、timeBetweenEvictionRunsMillis一起保证了所有超期的initialSize连接都会被重新连接,从而避免了Mysql长时间无动作会断掉连接的问题。
3.JVM参数
在JVM启动参数中,可以设置跟内存、垃圾回收相关的一些参数设置,默认情况不做任何设置JVM会工作的很好,但对一些配置很好的Server和具体的应用必须仔细调优才能获得最佳性能。通过设置我们希望达到一些目标:
- GC的时间足够的小
- GC的次数足够的少
- 发生Full GC的周期足够的长
前两个目前是相悖的,要想GC时间小必须要一个更小的堆,要保证GC次数足够少,必须保证一个更大的堆,我们只能取其平衡。
(1)针对JVM堆的设置,一般可以通过-Xms -Xmx限定其最小、最大值,为了防止垃圾收集器在最小、最大之间收缩堆而产生额外的时间,我们通常把最大、最小设置为相同的值
(2)年轻代和年老代将根据默认的比例(1:2)分配堆内存,可以通过调整二者之间的比率NewRadio来调整二者之间的大小,也可以针对回收代,比如年轻代,通过 -XX:newSize -XX:MaxNewSize来设置其绝对大小。同样,为了防止年轻代的堆收缩,我们通常会把-XX:newSize -XX:MaxNewSize设置为同样大小(3)年轻代和年老代设置多大才算合理?这个我问题毫无疑问是没有答案的,否则也就不会有调优。我们观察一下二者大小变化有哪些影响
- 更大的年轻代必然导致更小的年老代,大的年轻代会延长普通GC的周期,但会增加每次GC的时间;小的年老代会导致更频繁的Full GC
- 更小的年轻代必然导致更大年老代,小的年轻代会导致普通GC很频繁,但每次的GC时间会更短;大的年老代会减少Full GC的频率
- 如何选择应该依赖应用程序对象生命周期的分布情况:如果应用存在大量的临时对象,应该选择更大的年轻代;如果存在相对较多的持久对象,年老代应该适当增大。但很多应用都没有这样明显的特性,在抉择时应该根据以下两点:(A)本着Full GC尽量少的原则,让年老代尽量缓存常用对象,JVM的默认比例1:2也是这个道理 (B)通过观察应用一段时间,看其他在峰值时年老代会占多少内存,在不影响Full GC的前提下,根据实际情况加大年轻代,比如可以把比例控制在1:1。但应该给年老代至少预留1/3的增长空间
(4)在配置较好的机器上(比如多核、大内存),可以为年老代选择并行收集算法: -XX:+UseParallelOldGC ,默认为Serial收集
(5)线程堆栈的设置:每个线程默认会开启1M的堆栈,用于存放栈帧、调用参数、局部变量等,对大多数应用而言这个默认值太了,一般256K就足用。理论上,在内存不变的情况下,减少每个线程的堆栈,可以产生更多的线程,但这实际上还受限于操作系统。
(4)可以通过下面的参数打Heap Dump信息
- -XX:HeapDumpPath
- -XX:+PrintGCDetails
- -XX:+PrintGCTimeStamps
- -Xloggc:/usr/aaa/dump/heap_trace.txt
通过下面参数可以控制OutOfMemoryError时打印堆的信息
- -XX:+HeapDumpOnOutOfMemoryError
请看一下一个时间的Java参数配置:(服务器:Linux 64Bit,8Core×16G)
JAVA_OPTS="$JAVA_OPTS -server -Xms3G -Xmx3G -Xss256k -XX:PermSize=128m -XX:MaxPermSize=128m -XX:+UseParallelOldGC -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/usr/aaa/dump -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:/usr/aaa/dump/heap_trace.txt -XX:NewSize=1G -XX:MaxNewSize=1G"
经过观察该配置非常稳定,每次普通GC的时间在10ms左右,Full GC基本不发生,或隔很长很长的时间才发生一次
通过分析dump文件可以发现,每个1小时都会发生一次Full GC,经过多方求证,只要在JVM中开启了JMX服务,JMX将会1小时执行一次Full GC以清除引用,关于这点请参考附件文档。
4.程序算法调优:本次不作为重点
参考资料:
http://java.sun.com/javase/technologies/hotspot/gc/gc_tuning_6.html
来源:http://blog.csdn.net/chen77716/article/details/5695893
=======================================================================================
调优方法
一切都是为了这一步,调优,在调优之前,我们需要记住下面的原则:
1、多数的Java应用不需要在服务器上进行GC优化;
2、多数导致GC问题的Java应用,都不是因为我们参数设置错误,而是代码问题;
3、在应用上线之前,先考虑将机器的JVM参数设置到最优(最适合);
4、减少创建对象的数量;
5、减少使用全局变量和大对象;
6、GC优化是到最后不得已才采用的手段;
7、在实际使用中,分析GC情况优化代码比优化GC参数要多得多;
GC优化的目的有两个(http://www.360doc.com/content/13/0305/10/15643_269388816.shtml):
1、将转移到老年代的对象数量降低到最小;
2、减少full GC的执行时间;
为了达到上面的目的,一般地,你需要做的事情有:
1、减少使用全局变量和大对象;
2、调整新生代的大小到最合适;
3、设置老年代的大小为最合适;
4、选择合适的GC收集器;
在上面的4条方法中,用了几个“合适”,那究竟什么才算合适,一般的,请参考上面“收集器搭配”和“启动内存分配”两节中的建议。但这些建议不是万能的,需要根据您的机器和应用情况进行发展和变化,实际操作中,可以将两台机器分别设置成不同的GC参数,并且进行对比,选用那些确实提高了性能或减少了GC时间的参数。
真正熟练的使用GC调优,是建立在多次进行GC监控和调优的实战经验上的,进行监控和调优的一般步骤为:
1,监控GC的状态
使用各种JVM工具,查看当前日志,分析当前JVM参数设置,并且分析当前堆内存快照和gc日志,根据实际的各区域内存划分和GC执行时间,觉得是否进行优化;
2,分析结果,判断是否需要优化
如果各项参数设置合理,系统没有超时日志出现,GC频率不高,GC耗时不高,那么没有必要进行GC优化;如果GC时间超过1-3秒,或者频繁GC,则必须优化;
注:如果满足下面的指标,则一般不需要进行GC:
Minor GC执行时间不到50ms;
Minor GC执行不频繁,约10秒一次;
Full GC执行时间不到1s;
Full GC执行频率不算频繁,不低于10分钟1次;
3,调整GC类型和内存分配
如果内存分配过大或过小,或者采用的GC收集器比较慢,则应该优先调整这些参数,并且先找1台或几台机器进行beta,然后比较优化过的机器和没有优化的机器的性能对比,并有针对性的做出最后选择;
4,不断的分析和调整
通过不断的试验和试错,分析并找到最合适的参数
5,全面应用参数
如果找到了最合适的参数,则将这些参数应用到所有服务器,并进行后续跟踪。
调优实例
上面的内容都是纸上谈兵,下面我们以一些真实例子来进行说明:
实例1:
笔者昨日发现部分开发测试机器出现异常:java.lang.OutOfMemoryError: GC overhead limit exceeded,这个异常代表:
GC为了释放很小的空间却耗费了太多的时间,其原因一般有两个:1,堆太小,2,有死循环或大对象;
笔者首先排除了第2个原因,因为这个应用同时是在线上运行的,如果有问题,早就挂了。所以怀疑是这台机器中堆设置太小;
使用ps -ef |grep "java"查看,发现:
该应用的堆区设置只有768m,而机器内存有2g,机器上只跑这一个java应用,没有其他需要占用内存的地方。另外,这个应用比较大,需要占用的内存也比较多;
笔者通过上面的情况判断,只需要改变堆中各区域的大小设置即可,于是改成下面的情况:
跟踪运行情况发现,相关异常没有再出现;
实例2:(http://www.360doc.com/content/13/0305/10/15643_269388816.shtml)
一个服务系统,经常出现卡顿,分析原因,发现Full GC时间太长:
jstat -gcutil:
S0 S1 E O P YGC YGCT FGC FGCT GCT
12.16 0.00 5.18 63.78 20.32 54 2.047 5 6.946 8.993
分析上面的数据,发现Young GC执行了54次,耗时2.047秒,每次Young GC耗时37ms,在正常范围,而Full GC执行了5次,耗时6.946秒,每次平均1.389s,数据显示出来的问题是:Full GC耗时较长,分析该系统的是指发现,NewRatio=9,也就是说,新生代和老生代大小之比为1:9,这就是问题的原因:
1,新生代太小,导致对象提前进入老年代,触发老年代发生Full GC;
2,老年代较大,进行Full GC时耗时较大;
优化的方法是调整NewRatio的值,调整到4,发现Full GC没有再发生,只有Young GC在执行。这就是把对象控制在新生代就清理掉,没有进入老年代(这种做法对一些应用是很有用的,但并不是对所有应用都要这么做)
实例3:
一应用在性能测试过程中,发现内存占用率很高,Full GC频繁,使用sudo -u admin -H jmap -dump:format=b,file=文件名.hprof pid 来dump内存,生成dump文件,并使用Eclipse下的mat差距进行分析,发现:
从图中可以看出,这个线程存在问题,队列LinkedBlockingQueue所引用的大量对象并未释放,导致整个线程占用内存高达378m,此时通知开发人员进行代码优化,将相关对象释放掉即可。
Java内存种类
- Stack栈内存存取速度快,数据可多线程间共享。 存在栈中的数据大小与生存期必须确定
- Heap堆内存 大小动态变化,对象的生命周期不必事先告诉编译器JVM。
两种内存使用
- Stack栈内存 基本数据类型,Java 指令代码,常量 对象实例的引用 对象的方法代码
- Heap堆内存 对象实例的属性数据和数组。堆内存由Java虚拟机的自动垃圾回收器来管理。
对象如何保存在内存中?
- 对象的属性Attribute Property
属性值作为数据,保存在数据区heap 中,包括属性的类型Classtype和对象本身的类型
- 方法method
方法本身是指令的操作码,保存在stack中。
方法内部变量作为指令的操作数也是在Stack中, 包括基本类型和其他对象的引用。- 对象实例在heap 中分配好内存以后,需要在stack中保存一个4字节的heap内存地址,用来定位该对象实例在heap 中的位置,便于找到该对象实例。
静态属性和方法的特点
- 静态属性和方法都是保存在Stack中,
- Stack内存是共享的,其他线程都可以访问静态属性实际是全局变量。
- 静态方法在Stack,就无法访问Heap中的数据。静态方法无法访问普通对象中数据。
- 静态属性意味着全局变量,生命周期和JVM一致。JVM属于技术边界,静态只能用于技术边界内工具性质使用,不能用作业务。
内存管理:垃圾回收机制
- 每一种垃圾收集的算法(引用计数、复制、标记-清除和标记-整理等)在特定条件下都有其优点和缺点。
- 当有很多对象成为垃圾时,复制可以做得很好,但是复制许多生命周期长的对象时它就变得很糟(要反复复制它们)。
- 标记-整理适合生命周期长对象可以做得很好(只复制一次),但是不适合短生命的对象。
- Sun JVM 1.2 及以后版本使用的技术称为 分代垃圾收集(generational garbage collection),它结合了这两种技术以结合二者的长处。
可选用的GC类型
JVM性能优化
- 内存微调优化
- 锁争夺微调:
多线程 不变性 单写原则 Actor Disrupotor
- CPU使用率微调
- I/O 微调
内存微调优化
- 内存分配:
新生代 Eden和survior 旧生代内存大小分配。
内存越大,吞吐量越大,但是需要内存整理的时间就越长,响应时间有延迟。- 垃圾回收机制
垃圾回收启动整个应用都暂停,暂停时间造成响应时间有延迟。
- 在延迟性(响应时间)和吞吐量上取得一个平衡。
- 内存大小影响吞吐量和延迟性。需要在内存大小和响应时间之间取得一个平衡。
- 垃圾回收机制是延迟的最大问题。目标尽量不启动,少启动。
内存模型
新生代Eden内存分配
- 新生代(New Generation ):Eden + 1 Survivor。所有新创建的对象在Eden。
- 当Eden满了,启动Stop-The-World的GC,或为minor gc,采取数次复制Copy-Collection到Survivor。
- 经过几次收集,寿命不断延长的对象从Survivor 进入老生代,也称为进入保有Tenuring,类似普通缓存LRU算法。
survivor设计要旨
- 足够大到能容纳所有请求响应中涉及的对象数据。
- 每个survivor空间也要足够大到能够容纳活跃的请求对象和保有对象。
- Survivor大小决定了保有Tenuring阀值,阀值如果能大到容纳所有常住对象,那么保有迁移过程就越快。
老生代Old
- 老生代的gc称为major gc,就是通常说的full gc。
- 采用标记-整理算法。由于老年区域比较大,而且通常对象生命周期都比较长,标记-整理需要一定时间。所以这部分的gc时间比较长。
- minor gc可能引发full gc。当eden+from space的空间大于老生代的剩余空间时,会引发full gc。这是悲观算法,要确保eden+from space的对象如果都存活,必须有足够的老生代空间存放这些对象。
- 这些都根据情况调整启动JVM的设置。
- 使用 Adaptive让JVM自动划分新生代和老生代。
Permanent Generation 永久代
- 该区域比较稳定,主要用于存放classloader信息,比如类信息和method信息。
- 缺省是 64M ,如果你的代码量很大,容易出现OutOfMemoryError: PermGen space 。
- 2G以上内存设置MaxPermSize为160M
- -XX:PermSize=128m -XX:MaxPermSize=160m
降低Full GC发生概率
- 为了降低Full GC发生概率,如果降低了老生代大小,那么 OutOfMemoryError 发生,Full GC概率反而会上升。
- 如果为了降低Full GC,增加老生代大小,执行时间可能会被延长。
- 必须寻找合适大小的老生代。
- 避免大的对象迁移到老生代。
- 减少迁移到老生代的对象数目
java.lang.OutOfMemoryError
- (1)在高负荷的情况下的却需要很大的内存,因此可以通过修改JVM参数来增加Java Heap Memory。
- (2)应用程序使用对象或者资源没有释放,导致内存消耗持续增加,关键采取OO封装边界方式,树立对象都有生命周期的基本习惯。
- (3)再一种也可能是对于第三方开源项目中资源释放了解不够导致使用以后资源没有释放(例如JDBC的ResultSet等)。
JVM参数
- -Xms, -Xmx—定义JVM的heap大小最小和最大值。
- -XX:NewSize— 定义年轻态的最小大小,Eden越大越好,但是越大响应有延迟。
- -Xmx2G -Xms1G -XX:NewSIze=512M (OldGen at least 1G)
- -Xmx3G -Xms1G -XX:NewSize=512M (OldGen at least 2G)
- Xmx4G -Xms2G -XX:NewSize=1G (OldGen at least 2.5G)
- -Xmx6G -Xms3G -XX:NewSize=2G (OldGen at least 3.5G)
- -Xmx8G -Xms4G -XX:NewSize=3G (OldGen at least 4.5G)
参数调整示意
- JAVA_OPTS="$JAVA_OPTS -server -Xss1280K -Xms1664m -Xmx1664m -XX:MaxPermSize=128m -XX:SurvivorRatio=16 -XX:NewSize=1280m -XX:MaxNewSize=1280m -XX:+DisableExplicitGC -XX:GCTimeRatio=2 -XX:ParallelGCThreads=4 -XX:+UseParNewGC -XX:MaxGCPauseMillis=2000 -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=80 -XX:+CMSClassUnloadingEnabled
Survivor大小
- NewSize / ( SurvivorRatio + 2)
- 如果SurvivorRatio =16, NewSize =1280m,那么S大小是70M。
- 太小,溢出的复制Collection进入老生代。
- 太大,闲置无用 浪费内存。
- 使用XX:+PrintTenuringDistribution 和-XX:+PrintGCDetails, -XX:+PrintHeapAtGC观察:
- 与 -XX:+UseAdaptiveSizePolicy 冲突
垃圾回收机制启动
- 垃圾回收机制不会频繁启动,因为机制一旦启动,造成应用程序停顿。
- 机制一般内存剩余5%左右启动,所以有现象:启动服务器,内存不断消耗,有多大内存消耗多大。
- 问题:如果服务器程序频繁触及5%底线,机制频繁启动,造成服务器慢..甚至死机。
- 根源:应用程序无限制频繁大量创建对象,消耗内存。
控制垃圾回收
- 带CMS参数的都是和并发回收相关的
- -XX:+UseParNewGC,对新生代采用多线程并行回收。
- CMSInitiatingOccupancyFraction=90说明年老代到90%满的时候开始执行对年老代的并发垃圾回收(CMS)
- 用jmap和jstack查看
串行 并行回收的区别
- 新生代 高吞吐量:
- -XX:+UseSerialGC -XX:+UseParallelGC -XX:+UseParNewGC
- 老生代 低暂停:
- -XX:+UseParallelOldGC -XX:+UseConcMarkSweepGC
- 相同点:GC时都暂停一切。
- 不同点:一个线程和多个线程同时GC
并行和CMS(Concurrent-Mark-Sweep)区别
- CMS步骤:
- - initial mark - concurrent marking - remark - concurrent sweeping
- 区别:CMS一个线程,并行多个线程
- CMS只是在1 3阶段暂停,而并行全部暂停。
Parallel GC 和 CMS GC
- 压实compaction是移除内存碎片,也就是移除已经分配的内存之间的空白空间。
- 在Parallel GC中,无论Full GC是否执行,压实总是被执行,会花费更多时间,不过在执行完Full GC后,内存也许再被使用时,会分配得快些,能够顺序分配了。
- CMS GC 并不执行压实,所以更快,碎片太多,没有空间放置大的需要连续空间的对象,“Concurrent mode failure”会发生。
并行和CMS配置
- -XX:UserParNewGC 适合于
新生代 (multiple GC threads)
-XX:+UseConcMarkSweepGC 适合于 老生代 (one GC thread, freezes the JVM only during the initial mark and remark phases) -XX:InitiatingOccupancyFraction 80是表示CMS是在老生代接近满80%启动,如CPU空闲,可设定点一些。-XX:+CMSIncrementalMode 用于CMS,不会让处理器Hold住整个并发phases 。
Java 虚拟机有自己完善的硬件架构, 如处理器、堆栈、寄存器等,还具有相应的指令系统。JVM 屏蔽了与具体操作系统平台相关的信息,使得 Java 程序只需生成在 Java 虚拟机上运行的目标代码 (字节码), 就可以在多种平台上不加修改地运行。Java 虚拟机在执行字节码时,实际上最终还是把字节码解释成具体平台上的机器指令执行。
注意:本文仅针对 JDK7、HotSPOT Java 虚拟机,对于 JDK8 引入的 JVM 新特性及其他 Java 虚拟机,本文不予关注。
我们以一个例子开始这篇文章。假设你是一个普通的 Java 对象,你出生在 Eden 区,在 Eden 区有许多和你差不多的小兄弟、小姐妹,可以把 Eden 区当成幼儿园,在这个幼儿园里大家玩了很长时间。Eden 区不能无休止地放你们在里面,所以当年纪稍大,你就要被送到学校去上学,这里假设从小学到高中都称为 Survivor 区。开始的时候你在 Survivor 区里面划分出来的的“From”区,读到高年级了,就进了 Survivor 区的“To”区,中间由于学习成绩不稳定,还经常来回折腾。直到你 18 岁的时候,高中毕业了,该去社会上闯闯了。于是你就去了年老代,年老代里面人也很多。在年老代里,你生活了 20 年 (每次 GC 加一岁),最后寿终正寝,被 GC 回收。有一点没有提,你在年老代遇到了一个同学,他的名字叫爱德华 (慕光之城里的帅哥吸血鬼),他以及他的家族永远不会死,那么他们就生活在永生代。
之前的文章中已经介绍过年轻代、年老代、永生代,本文主要讲讲如何运用这些区域,为系统性能提供更好的帮助。本文不再重复这些概念,直接进入主题。
如何将新对象预留在年轻代
众所周知,由于 Full GC 的成本远远高于 Minor GC,因此某些情况下需要尽可能将对象分配在年轻代,这在很多情况下是一个明智的选择。虽然在大部分情况下,JVM 会尝试在 Eden 区分配对象,但是由于空间紧张等问题,很可能不得不将部分年轻对象提前向年老代压缩。因此,在 JVM 参数调优时可以为应用程序分配一个合理的年轻代空间,以最大限度避免新对象直接进入年老代的情况发生。清单 1 所示代码尝试分配 4MB 内存空间,观察一下它的内存使用情况。
清单 1. 相同大小内存分配
public class PutInEden { public static void main(String[] args){ byte[] b1,b2,b3,b4;//定义变量 b1=new byte[1024*1024];//分配 1MB 堆空间,考察堆空间的使用情况 b2=new byte[1024*1024]; b3=new byte[1024*1024]; b4=new byte[1024*1024]; }}
使用 JVM 参数-XX:+PrintGCDetails -Xmx20M -Xms20M 运行清单 1 所示代码,输出如清单 2 所示。
清单 2. 清单 1 运行输出
[GC [DefNew: 5504K->640K(6144K), 0.0114236 secs] 5504K->5352K(19840K), 0.0114595 secs] [Times: user=0.02 sys=0.00, real=0.02 secs] [GC [DefNew: 6144K->640K(6144K), 0.0131261 secs] 10856K->10782K(19840K),0.0131612 secs] [Times: user=0.02 sys=0.00, real=0.02 secs] [GC [DefNew: 6144K->6144K(6144K), 0.0000170 secs][Tenured: 10142K->13695K(13696K),0.1069249 secs] 16286K->15966K(19840K), [Perm : 376K->376K(12288K)],0.1070058 secs] [Times: user=0.03 sys=0.00, real=0.11 secs] [Full GC [Tenured: 13695K->13695K(13696K), 0.0302067 secs] 19839K->19595K(19840K), [Perm : 376K->376K(12288K)], 0.0302635 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] [Full GC [Tenured: 13695K->13695K(13696K), 0.0311986 secs] 19839K->19839K(19840K), [Perm : 376K->376K(12288K)], 0.0312515 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] [Full GC [Tenured: 13695K->13695K(13696K), 0.0358821 secs] 19839K->19825K(19840K), [Perm : 376K->371K(12288K)], 0.0359315 secs] [Times: user=0.05 sys=0.00, real=0.05 secs] [Full GC [Tenured: 13695K->13695K(13696K), 0.0283080 secs] 19839K->19839K(19840K),[Perm : 371K->371K(12288K)], 0.0283723 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] [Full GC [Tenured: 13695K->13695K(13696K), 0.0284469 secs] 19839K->19839K(19840K),[Perm : 371K->371K(12288K)], 0.0284990 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] [Full GC [Tenured: 13695K->13695K(13696K), 0.0283005 secs] 19839K->19839K(19840K),[Perm : 371K->371K(12288K)], 0.0283475 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] [Full GC [Tenured: 13695K->13695K(13696K), 0.0287757 secs] 19839K->19839K(19840K),[Perm : 371K->371K(12288K)], 0.0288294 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] [Full GC [Tenured: 13695K->13695K(13696K), 0.0288219 secs] 19839K->19839K(19840K), [Perm : 371K->371K(12288K)], 0.0288709 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] [Full GC [Tenured: 13695K->13695K(13696K), 0.0293071 secs] 19839K->19839K(19840K),[Perm : 371K->371K(12288K)], 0.0293607 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] [Full GC [Tenured: 13695K->13695K(13696K), 0.0356141 secs] 19839K->19838K(19840K),[Perm : 371K->371K(12288K)], 0.0356654 secs] [Times: user=0.01 sys=0.00, real=0.03 secs] Heap def new generation total 6144K, used 6143K [0x35c10000, 0x362b0000, 0x362b0000) eden space 5504K, 100% used [0x35c10000, 0x36170000, 0x36170000) from space 640K, 99% used [0x36170000, 0x3620fc80, 0x36210000) to space 640K, 0% used [0x36210000, 0x36210000, 0x362b0000) tenured generation total 13696K, used 13695K [0x362b0000, 0x37010000, 0x37010000) the space 13696K, 99% used [0x362b0000, 0x3700fff8, 0x37010000, 0x37010000) compacting perm gen total 12288K, used 371K [0x37010000, 0x37c10000, 0x3b010000) the space 12288K, 3% used [0x37010000, 0x3706cd20, 0x3706ce00, 0x37c10000) ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000)
清单 2 所示的日志输出显示年轻代 Eden 的大小有 5MB 左右。分配足够大的年轻代空间,使用 JVM 参数-XX:+PrintGCDetails -Xmx20M -Xms20M-Xmn6M 运行清单 1 所示代码,输出如清单 3 所示。
清单 3. 增大 Eden 大小后清单 1 运行输出
[GC [DefNew: 4992K->576K(5568K), 0.0116036 secs] 4992K->4829K(19904K), 0.0116439 secs] [Times: user=0.02 sys=0.00, real=0.02 secs] [GC [DefNew: 5568K->576K(5568K), 0.0130929 secs] 9821K->9653K(19904K), 0.0131336 secs] [Times: user=0.02 sys=0.00, real=0.02 secs] [GC [DefNew: 5568K->575K(5568K), 0.0154148 secs] 14645K->14500K(19904K),0.0154531 secs] [Times: user=0.00 sys=0.01, real=0.01 secs] [GC [DefNew: 5567K->5567K(5568K), 0.0000197 secs][Tenured: 13924K->14335K(14336K),0.0330724 secs] 19492K->19265K(19904K), [Perm : 376K->376K(12288K)],0.0331624 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] [Full GC [Tenured: 14335K->14335K(14336K), 0.0292459 secs] 19903K->19902K(19904K),[Perm : 376K->376K(12288K)], 0.0293000 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] [Full GC [Tenured: 14335K->14335K(14336K), 0.0278675 secs] 19903K->19903K(19904K),[Perm : 376K->376K(12288K)], 0.0279215 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] [Full GC [Tenured: 14335K->14335K(14336K), 0.0348408 secs] 19903K->19889K(19904K),[Perm : 376K->371K(12288K)], 0.0348945 secs] [Times: user=0.05 sys=0.00, real=0.05 secs] [Full GC [Tenured: 14335K->14335K(14336K), 0.0299813 secs] 19903K->19903K(19904K),[Perm : 371K->371K(12288K)], 0.0300349 secs] [Times: user=0.01 sys=0.00, real=0.02 secs] [Full GC [Tenured: 14335K->14335K(14336K), 0.0298178 secs] 19903K->19903K(19904K),[Perm : 371K->371K(12288K)], 0.0298688 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] Exception in thread "main" java.lang.OutOfMemoryError: Java heap space[Full GC [Tenured: 14335K->14335K(14336K), 0.0294953 secs] 19903K->19903K(19904K),[Perm : 371K->371K(12288K)], 0.0295474 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] [Full GC [Tenured: 14335K->14335K(14336K), 0.0287742 secs] 19903K->19903K(19904K), [Perm : 371K->371K(12288K)], 0.0288239 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] [Full GC [Tenuredat GCTimeTest.main(GCTimeTest.java:16): 14335K->14335K(14336K), 0.0287102 secs] 19903K->19903K(19904K),[Perm : 371K->371K(12288K)], 0.0287627 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] Heap def new generation total 5568K, used 5567K [0x35c10000, 0x36210000, 0x36210000) eden space 4992K, 100% used [0x35c10000, 0x360f0000, 0x360f0000) from space 576K, 99% used [0x36180000, 0x3620ffe8, 0x36210000) to space 576K, 0% used [0x360f0000, 0x360f0000, 0x36180000) tenured generation total 14336K, used 14335K [0x36210000, 0x37010000, 0x37010000) the space 14336K, 99% used [0x36210000, 0x3700ffd8, 0x37010000, 0x37010000) compacting perm gen total 12288K, used 371K [0x37010000, 0x37c10000, 0x3b010000) the space 12288K, 3% used [0x37010000, 0x3706ce28, 0x3706d000, 0x37c10000) ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000)
通过清单 2 和清单 3 对比,可以发现通过设置一个较大的年轻代预留新对象,设置合理的 Survivor 区并且提供 Survivor 区的使用率,可以将年轻对象保存在年轻代。一般来说,Survivor 区的空间不够,或者占用量达到 50%时,就会使对象进入年老代 (不管它的年龄有多大)。清单 4 创建了 3 个对象,分别分配一定的内存空间。
清单 4. 不同大小内存分配
public class PutInEden2 { public static void main(String[] args){ byte[] b1,b2,b3; b1=new byte[1024*512];//分配 0.5MB 堆空间 b2=new byte[1024*1024*4];//分配 4MB 堆空间 b3=new byte[1024*1024*4]; b3=null; //使 b3 可以被回收 b3=new byte[1024*1024*4];//分配 4MB 堆空间 }}
使用参数-XX:+PrintGCDetails -Xmx1000M -Xms500M -Xmn100M -XX:SurvivorRatio=8 运行清单 4 所示代码,输出如清单 5 所示。
清单 5. 清单 4 运行输出
Heap def new generation total 92160K, used 11878K [0x0f010000, 0x15410000, 0x15410000) eden space 81920K, 2% used [0x0f010000, 0x0f1a9a20, 0x14010000) from space 10240K, 99% used [0x14a10000, 0x1540fff8, 0x15410000) to space 10240K, 0% used [0x14010000, 0x14010000, 0x14a10000) tenured generation total 409600K, used 86434K [0x15410000, 0x2e410000, 0x4d810000) the space 409600K, 21% used [0x15410000, 0x1a878b18, 0x1a878c00, 0x2e410000) compacting perm gen total 12288K, used 2062K [0x4d810000, 0x4e410000, 0x51810000) the space 12288K, 16% used [0x4d810000, 0x4da13b18, 0x4da13c00, 0x4e410000)No shared spaces configured.
清单 5 输出的日志显示,年轻代分配了 8M,年老代也分配了 8M。我们可以尝试加上-XX:TargetSurvivorRatio=90 参数,这样可以提高 from 区的利用率,使 from 区使用到 90%时,再将对象送入年老代,运行清单 4 代码,输出如清单 6 所示。
清单 6. 修改运行参数后清单 4 输出
Heap def new generation total 9216K, used 9215K [0x35c10000, 0x36610000, 0x36610000) eden space 8192K, 100% used [0x35c10000, 0x36410000, 0x36410000) from space 1024K, 99% used [0x36510000, 0x3660fc50, 0x36610000) to space 1024K, 0% used [0x36410000, 0x36410000, 0x36510000) tenured generation total 10240K, used 10239K [0x36610000, 0x37010000, 0x37010000) the space 10240K, 99% used [0x36610000, 0x3700ff70, 0x37010000, 0x37010000) compacting perm gen total 12288K, used 371K [0x37010000, 0x37c10000, 0x3b010000) the space 12288K, 3% used [0x37010000, 0x3706cd90, 0x3706ce00, 0x37c10000) ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000)
如果将 SurvivorRatio 设置为 2,将 b1 对象预存在年轻代。输出如清单 7 所示。
清单 7. 再次修改运行参数后清单 4 输出
Heap def new generation total 7680K, used 7679K [0x35c10000, 0x36610000, 0x36610000) eden space 5120K, 100% used [0x35c10000, 0x36110000, 0x36110000) from space 2560K, 99% used [0x36110000, 0x3638fff0, 0x36390000) to space 2560K, 0% used [0x36390000, 0x36390000, 0x36610000) tenured generation total 10240K, used 10239K [0x36610000, 0x37010000, 0x37010000) the space 10240K, 99% used [0x36610000, 0x3700fff0, 0x37010000, 0x37010000) compacting perm gen total 12288K, used 371K [0x37010000, 0x37c10000, 0x3b010000) the space 12288K, 3% used [0x37010000, 0x3706ce28, 0x3706d000, 0x37c10000) ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000)rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000)
如何让大对象进入年老代
我们在大部分情况下都会选择将对象分配在年轻代。但是,对于占用内存较多的大对象而言,它的选择可能就不是这样的。因为大对象出现在年轻代很可能扰乱年轻代 GC,并破坏年轻代原有的对象结构。因为尝试在年轻代分配大对象,很可能导致空间不足,为了有足够的空间容纳大对象,JVM 不得不将年轻代中的年轻对象挪到年老代。因为大对象占用空间多,所以可能需要移动大量小的年轻对象进入年老代,这对 GC 相当不利。基于以上原因,可以将大对象直接分配到年老代,保持年轻代对象结构的完整性,这样可以提高 GC 的效率。如果一个大对象同时又是一个短命的对象,假设这种情况出现很频繁,那对于 GC 来说会是一场灾难。原本应该用于存放永久对象的年老代,被短命的对象塞满,这也意味着对堆空间进行了洗牌,扰乱了分代内存回收的基本思路。因此,在软件开发过程中,应该尽可能避免使用短命的大对象。可以使用参数-XX:PetenureSizeThreshold 设置大对象直接进入年老代的阈值。当对象的大小超过这个值时,将直接在年老代分配。参数-XX:PetenureSizeThreshold 只对串行收集器和年轻代并行收集器有效,并行回收收集器不识别这个参数。
清单 8. 创建一个大对象
public class BigObj2Old { public static void main(String[] args){ byte[] b; b = new byte[1024*1024];//分配一个 1MB 的对象 }}
使用 JVM 参数-XX:+PrintGCDetails –Xmx20M –Xms20MB 运行,可以得到清单 9 所示日志输出。
清单 9. 清单 8 运行输出
Heap def new generation total 6144K, used 1378K [0x35c10000, 0x362b0000, 0x362b0000) eden space 5504K, 25% used [0x35c10000, 0x35d689e8, 0x36170000) from space 640K, 0% used [0x36170000, 0x36170000, 0x36210000) to space 640K, 0% used [0x36210000, 0x36210000, 0x362b0000) tenured generation total 13696K, used 0K [0x362b0000, 0x37010000, 0x37010000) the space 13696K, 0% used [0x362b0000, 0x362b0000, 0x362b0200, 0x37010000) compacting perm gen total 12288K, used 374K [0x37010000, 0x37c10000, 0x3b010000) the space 12288K, 3% used [0x37010000, 0x3706dac8, 0x3706dc00, 0x37c10000) ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000)
可以看到该对象被分配在了年轻代,占用了 25%的空间。如果需要将 1MB 以上的对象直接在年老代分配,设置-XX:PetenureSizeThreshold=1000000,程序运行后输出如清单 10 所示。
清单 10. 修改运行参数后清单 8 输出
Heap def new generation total 6144K, used 354K [0x35c10000, 0x362b0000, 0x362b0000) eden space 5504K, 6% used [0x35c10000, 0x35c689d8, 0x36170000) from space 640K, 0% used [0x36170000, 0x36170000, 0x36210000) to space 640K, 0% used [0x36210000, 0x36210000, 0x362b0000) tenured generation total 13696K, used 1024K [0x362b0000, 0x37010000, 0x37010000) the space 13696K, 7% used [0x362b0000, 0x363b0010, 0x363b0200, 0x37010000) compacting perm gen total 12288K, used 374K [0x37010000, 0x37c10000, 0x3b010000) the space 12288K, 3% used [0x37010000, 0x3706dac8, 0x3706dc00, 0x37c10000) ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000)
清单 10 里面可以看到当满 1MB 时进入到了年老代。
如何设置对象进入年老代的年龄
堆中的每一个对象都有自己的年龄。一般情况下,年轻对象存放在年轻代,年老对象存放在年老代。为了做到这点,虚拟机为每个对象都维护一个年龄。如果对象在 Eden 区,经过一次 GC 后依然存活,则被移动到 Survivor 区中,对象年龄加 1。以后,如果对象每经过一次 GC 依然存活,则年龄再加 1。当对象年龄达到阈值时,就移入年老代,成为老年对象。这个阈值的最大值可以通过参数-XX:MaxTenuringThreshold 来设置,默认值是 15。虽然-XX:MaxTenuringThreshold 的值可能是 15 或者更大,但这不意味着新对象非要达到这个年龄才能进入年老代。事实上,对象实际进入年老代的年龄是虚拟机在运行时根据内存使用情况动态计算的,这个参数指定的是阈值年龄的最大值。即,实际晋升年老代年龄等于动态计算所得的年龄与-XX:MaxTenuringThreshold 中较小的那个。清单 11 所示代码为 3 个对象申请了若干内存。
清单 11. 申请内存
public class MaxTenuringThreshold { public static void main(String args[]){ byte[] b1,b2,b3; b1 = new byte[1024*512]; b2 = new byte[1024*1024*2]; b3 = new byte[1024*1024*4]; b3 = null; b3 = new byte[1024*1024*4]; }}
参数设置为:-XX:+PrintGCDetails -Xmx20M -Xms20M -Xmn10M -XX:SurvivorRatio=2
运行清单 11 所示代码,输出如清单 12 所示。
清单 12. 清单 11 运行输出
[GC [DefNew: 2986K->690K(7680K), 0.0246816 secs] 2986K->2738K(17920K), 0.0247226 secs] [Times: user=0.00 sys=0.02, real=0.03 secs] [GC [DefNew: 4786K->690K(7680K), 0.0016073 secs] 6834K->2738K(17920K), 0.0016436 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] Heap def new generation total 7680K, used 4888K [0x35c10000, 0x36610000, 0x36610000) eden space 5120K, 82% used [0x35c10000, 0x36029a18, 0x36110000) from space 2560K, 26% used [0x36110000, 0x361bc950, 0x36390000) to space 2560K, 0% used [0x36390000, 0x36390000, 0x36610000) tenured generation total 10240K, used 2048K [0x36610000, 0x37010000, 0x37010000) the space 10240K, 20% used [0x36610000, 0x36810010, 0x36810200, 0x37010000) compacting perm gen total 12288K, used 374K [0x37010000, 0x37c10000, 0x3b010000) the space 12288K, 3% used [0x37010000, 0x3706db50, 0x3706dc00, 0x37c10000) ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000)
更改参数为-XX:+PrintGCDetails -Xmx20M -Xms20M -Xmn10M -XX:SurvivorRatio=2 -XX:MaxTenuringThreshold=1,运行清单 11 所示代码,输出如清单 13 所示。
清单 13. 修改运行参数后清单 11 输出
[GC [DefNew: 2986K->690K(7680K), 0.0047778 secs] 2986K->2738K(17920K), 0.0048161 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] [GC [DefNew: 4888K->0K(7680K), 0.0016271 secs] 6936K->2738K(17920K),0.0016630 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] Heap def new generation total 7680K, used 4198K [0x35c10000, 0x36610000, 0x36610000) eden space 5120K, 82% used [0x35c10000, 0x36029a18, 0x36110000) from space 2560K, 0% used [0x36110000, 0x36110088, 0x36390000) to space 2560K, 0% used [0x36390000, 0x36390000, 0x36610000) tenured generation total 10240K, used 2738K [0x36610000, 0x37010000, 0x37010000) the space 10240K, 26% used [0x36610000, 0x368bc890, 0x368bca00, 0x37010000) compacting perm gen total 12288K, used 374K [0x37010000, 0x37c10000, 0x3b010000) the space 12288K, 3% used [0x37010000, 0x3706db50, 0x3706dc00, 0x37c10000) ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000)
清单 13 所示,第一次运行时 b1 对象在程序结束后依然保存在年轻代。第二次运行前,我们减小了对象晋升年老代的年龄,设置为 1。即,所有经过一次 GC 的对象都可以直接进入年老代。程序运行后,可以发现 b1 对象已经被分配到年老代。如果希望对象尽可能长时间地停留在年轻代,可以设置一个较大的阈值。
稳定的 Java 堆 VS 动荡的 Java 堆
一般来说,稳定的堆大小对垃圾回收是有利的。获得一个稳定的堆大小的方法是使-Xms 和-Xmx 的大小一致,即最大堆和最小堆 (初始堆) 一样。如果这样设置,系统在运行时堆大小理论上是恒定的,稳定的堆空间可以减少 GC 的次数。因此,很多服务端应用都会将最大堆和最小堆设置为相同的数值。但是,一个不稳定的堆并非毫无用处。稳定的堆大小虽然可以减少 GC 次数,但同时也增加了每次 GC 的时间。让堆大小在一个区间中震荡,在系统不需要使用大内存时,压缩堆空间,使 GC 应对一个较小的堆,可以加快单次 GC 的速度。基于这样的考虑,JVM 还提供了两个参数用于压缩和扩展堆空间。
-XX:MinHeapFreeRatio 参数用来设置堆空间最小空闲比例,默认值是 40。当堆空间的空闲内存小于这个数值时,JVM 便会扩展堆空间。
-XX:MaxHeapFreeRatio 参数用来设置堆空间最大空闲比例,默认值是 70。当堆空间的空闲内存大于这个数值时,便会压缩堆空间,得到一个较小的堆。
当-Xmx 和-Xms 相等时,-XX:MinHeapFreeRatio 和-XX:MaxHeapFreeRatio 两个参数无效。
清单 14. 堆大小设置
import java.util.Vector;public class HeapSize { public static void main(String args[]) throws InterruptedException{ Vector v = new Vector(); while(true){ byte[] b = new byte[1024*1024]; v.add(b); if(v.size() == 10){ v = new Vector(); } Thread.sleep(1); } }}
清单 14 所示代码是测试-XX:MinHeapFreeRatio 和-XX:MaxHeapFreeRatio 的作用,设置运行参数为-XX:+PrintGCDetails -Xms10M -Xmx40M -XX:MinHeapFreeRatio=40 -XX:MaxHeapFreeRatio=50 时,输出如清单 15 所示。
清单 15. 修改运行参数后清单 14 输出
[GC [DefNew: 2418K->178K(3072K), 0.0034827 secs] 2418K->2226K(9920K), 0.0035249 secs] [Times: user=0.00 sys=0.00, real=0.03 secs] [GC [DefNew: 2312K->0K(3072K), 0.0028263 secs] 4360K->4274K(9920K), 0.0029905 secs] [Times: user=0.00 sys=0.00, real=0.03 secs] [GC [DefNew: 2068K->0K(3072K), 0.0024363 secs] 6342K->6322K(9920K),0.0024836 secs] [Times: user=0.00 sys=0.00, real=0.03 secs] [GC [DefNew: 2061K->0K(3072K), 0.0017376 secs][Tenured: 8370K->8370K(8904K),0.1392692 secs] 8384K->8370K(11976K), [Perm : 374K->374K(12288K)],0.1411363 secs] [Times: user=0.00 sys=0.02, real=0.16 secs] [GC [DefNew: 5138K->0K(6336K), 0.0038237 secs] 13508K->13490K(20288K),0.0038632 secs] [Times: user=0.00 sys=0.00, real=0.03 secs]
改用参数:-XX:+PrintGCDetails -Xms40M -Xmx40M -XX:MinHeapFreeRatio=40 -XX:MaxHeapFreeRatio=50,运行输出如清单 16 所示。
清单 16. 再次修改运行参数后清单 14 输出
[GC [DefNew: 10678K->178K(12288K), 0.0019448 secs] 10678K->178K(39616K), 0.0019851 secs] [Times: user=0.00 sys=0.00, real=0.03 secs] [GC [DefNew: 10751K->178K(12288K), 0.0010295 secs] 10751K->178K(39616K),0.0010697 secs] [Times: user=0.00 sys=0.00, real=0.02 secs] [GC [DefNew: 10493K->178K(12288K), 0.0008301 secs] 10493K->178K(39616K),0.0008672 secs] [Times: user=0.00 sys=0.00, real=0.02 secs] [GC [DefNew: 10467K->178K(12288K), 0.0008522 secs] 10467K->178K(39616K),0.0008905 secs] [Times: user=0.00 sys=0.00, real=0.02 secs] [GC [DefNew: 10450K->178K(12288K), 0.0008964 secs] 10450K->178K(39616K),0.0009339 secs] [Times: user=0.00 sys=0.00, real=0.01 secs] [GC [DefNew: 10439K->178K(12288K), 0.0009876 secs] 10439K->178K(39616K),0.0010279 secs] [Times: user=0.00 sys=0.00, real=0.02 secs]
从清单 16 可以看出,此时堆空间的垃圾回收稳定在一个固定的范围。在一个稳定的堆中,堆空间大小始终不变,每次 GC 时,都要应对一个 40MB 的空间。因此,虽然 GC 次数减小了,但是单次 GC 速度不如一个震荡的堆。
增大吞吐量提升系统性能
吞吐量优先的方案将会尽可能减少系统执行垃圾回收的总时间,故可以考虑关注系统吞吐量的并行回收收集器。在拥有高性能的计算机上,进行吞吐量优先优化,可以使用参数:
java –Xmx3800m –Xms3800m –Xmn2G –Xss128k –XX:+UseParallelGC –XX:ParallelGC-Threads=20 –XX:+UseParallelOldGC
–Xmx380m –Xms3800m:设置 Java 堆的最大值和初始值。一般情况下,为了避免堆内存的频繁震荡,导致系统性能下降,我们的做法是设置最大堆等于最小堆。假设这里把最小堆减少为最大堆的一半,即 1900m,那么 JVM 会尽可能在 1900MB 堆空间中运行,如果这样,发生 GC 的可能性就会比较高;
-Xss128k:减少线程栈的大小,这样可以使剩余的系统内存支持更多的线程;
-Xmn2g:设置年轻代区域大小为 2GB;
–XX:+UseParallelGC:年轻代使用并行垃圾回收收集器。这是一个关注吞吐量的收集器,可以尽可能地减少 GC 时间。
–XX:ParallelGC-Threads:设置用于垃圾回收的线程数,通常情况下,可以设置和 CPU 数量相等。但在 CPU 数量比较多的情况下,设置相对较小的数值也是合理的;
–XX:+UseParallelOldGC:设置年老代使用并行回收收集器。
尝试使用大的内存分页
CPU 是通过寻址来访问内存的。32 位 CPU 的寻址宽度是 0~0xFFFFFFFF ,计算后得到的大小是 4G,也就是说可支持的物理内存最大是 4G。但在实践过程中,碰到了这样的问题,程序需要使用 4G 内存,而可用物理内存小于 4G,导致程序不得不降低内存占用。为了解决此类问题,现代 CPU 引入了 MMU(Memory Management Unit 内存管理单元)。MMU 的核心思想是利用虚拟地址替代物理地址,即 CPU 寻址时使用虚址,由 MMU 负责将虚址映射为物理地址。MMU 的引入,解决了对物理内存的限制,对程序来说,就像自己在使用 4G 内存一样。内存分页 (Paging) 是在使用 MMU 的基础上,提出的一种内存管理机制。它将虚拟地址和物理地址按固定大小(4K)分割成页 (page) 和页帧 (page frame),并保证页与页帧的大小相同。这种机制,从数据结构上,保证了访问内存的高效,并使 OS 能支持非连续性的内存分配。在程序内存不够用时,还可以将不常用的物理内存页转移到其他存储设备上,比如磁盘,这就是大家耳熟能详的虚拟内存。
在 Solaris 系统中,JVM 可以支持 Large Page Size 的使用。使用大的内存分页可以增强 CPU 的内存寻址能力,从而提升系统的性能。
java –Xmx2506m –Xms2506m –Xmn1536m –Xss128k –XX:++UseParallelGC –XX:ParallelGCThreads=20 –XX:+UseParallelOldGC –XX:+LargePageSizeInBytes=256m
–XX:+LargePageSizeInBytes:设置大页的大小。
过大的内存分页会导致 JVM 在计算 Heap 内部分区(perm, new, old)内存占用比例时,会出现超出正常值的划分,最坏情况下某个区会多占用一个页的大小。
使用非占有的垃圾回收器
为降低应用软件的垃圾回收时的停顿,首先考虑的是使用关注系统停顿的 CMS 回收器,其次,为了减少 Full GC 次数,应尽可能将对象预留在年轻代,因为年轻代 Minor GC 的成本远远小于年老代的 Full GC。
java –Xmx3550m –Xms3550m –Xmn2g –Xss128k –XX:ParallelGCThreads=20 –XX:+UseConcMarkSweepGC –XX:+UseParNewGC –XX:+SurvivorRatio=8 –XX:TargetSurvivorRatio=90 –XX:MaxTenuringThreshold=31
–XX:ParallelGCThreads=20:设置 20 个线程进行垃圾回收;
–XX:+UseParNewGC:年轻代使用并行回收器;
–XX:+UseConcMarkSweepGC:年老代使用 CMS 收集器降低停顿;
–XX:+SurvivorRatio:设置 Eden 区和 Survivor 区的比例为 8:1。稍大的 Survivor 空间可以提高在年轻代回收生命周期较短的对象的可能性,如果 Survivor 不够大,一些短命的对象可能直接进入年老代,这对系统来说是不利的。
–XX:TargetSurvivorRatio=90:设置 Survivor 区的可使用率。这里设置为 90%,则允许 90%的 Survivor 空间被使用。默认值是 50%。故该设置提高了 Survivor 区的使用率。当存放的对象超过这个百分比,则对象会向年老代压缩。因此,这个选项更有助于将对象留在年轻代。
–XX:MaxTenuringThreshold:设置年轻对象晋升到年老代的年龄。默认值是 15 次,即对象经过 15 次 Minor GC 依然存活,则进入年老代。这里设置为 31,目的是让对象尽可能地保存在年轻代区域。