天天看點

Java記憶體管理基礎篇 - Java記憶體配置設定

1.簡介

現摘錄一段Java5記憶體管理白皮書中的一段話:

One strength of the Java™ 2 Platform, Standard Edition (J2SE™) is that it performs automatic memory

management, thereby shielding the developer from the complexity of explicit memory management.

由上面我們可以知道,Java平台采用了自動的記憶體管理方式,那麼JVM是如何進行記憶體管理的呢?

Java的記憶體管理實際上包含兩個方面:

1).Java記憶體配置設定

2).Java的記憶體回收

搞清楚了這兩個問題,Java的記憶體管理就清楚了。

寫這篇文章之前,問了自己一個問題:

Java采用了自動的記憶體管理方式,程式員實際上不用關心記憶體管理的細節,那為什麼我們仍然需要了解Java記憶體管理的内幕?

原因有三:

1.了解Java記憶體管理的細節,有助于程式員編寫出性能更好的程式。比如,在新的線程建立時,JVM會為每個線程建立一個專屬的棧(stack),其棧是先進後出的資料結構,這種方式的特點,讓程式員程式設計時,必須特别注意遞歸方法要盡量少使用,另外棧的大小也有一定的限制,如果過多的遞歸,容易導緻stack overflow。

2.了解Java記憶體管理的細節,一旦記憶體管理出現問題,有助于找到問題的根本原因所在。

3.了解Java記憶體管理的内幕,有助于優化JVM,進而使得自己的應用獲得最佳的性能體驗。

JVM的體系結構如下:

如下圖所示,JVM的體系結構包含幾個主要的子系統和記憶體區:

類裝載子系統 ,負責把類從檔案系統中裝入記憶體

GC子系統 ,垃圾收集器的主要工作室自動回收不再運作的程式引用對象所占用的記憶體,此外,它還可能負責那些還在使用的對象,以減少的堆碎片。

記憶體區 ,用于存儲位元組碼,程式運作時建立的對象,傳遞給方法的參數,傳回值,局部變量和中間計算結果。

執行引擎:

1、最簡單的:一次性解釋位元組碼。

2、快,但消耗記憶體的:“即時編譯器”,第一次被執行的位元組碼會被編譯成機器代碼,放入緩存,以後調用可以重用。

3、自适應優化器,虛拟機開始的時候會解釋位元組碼,但是會監視運作中程式的活動,并記錄下使用最頻繁的代碼段。程式運作的時候,虛拟機隻把使用最頻繁的代碼編譯成本地代碼,其他的代碼由于使用的并不頻繁,繼續保留為位元組碼--由虛拟機繼續解釋他們。一般可以使java虛拟機80%~90%的時間裡執行被優化過的本地代碼,隻需要編譯10%~20%對性能優影響的代碼。

4、由硬體晶片組成,他用本地方法執行java位元組碼,這種執行引擎實際上是内嵌在晶片裡的。

Java記憶體管理基礎篇 - Java記憶體配置設定

2. Java的記憶體配置設定

在Java程式運作過程中,JVM定義了各種區域用于存儲運作時資料。其中的有些資料區域在JVM啟動時建立,并隻在JVM退出時銷毀。其它的資料區域與每個線程相關。這些資料區域,線上程建立時建立,線上程退出時銷毀。

2.1 程式計數器寄存器(The

pc

Register)

JVM支援多個線程同時運作。每個JVM都有自己的程式計數器。在任何一個點,每個JVM線程執行單個方法的代碼,這個方法是線程的目前方法。如果方法不是native的,程式計數器寄存器包含了目前執行的JVM指令的位址,如果方法是 native的,程式計數器寄存器的值不會被定義。 JVM的程式計數器寄存器的寬度足夠保證可以持有一個傳回位址或者native的指針。

2.2 棧

1)棧與線程

JVM是基于棧的虛拟機.JVM為每個新建立的線程都配置設定一個棧.也就是說,對于一個Java程式來說,它的運作就是通過對棧的操作來完成的。棧以幀為機關儲存線程的狀态。JVM對棧隻進行兩種操作:以幀為機關的壓棧和出棧操作。

我們知道,某個線程正在執行的方法稱為此線程的目前方法.我們可能不知道,目前方法使用的幀稱為目前幀。當線程激活一個Java方法,JVM就會線上程的 Java堆棧裡新壓入一個幀。這個幀自然成為了目前幀.在此方法執行期間,這個幀将用來儲存參數,局部變量,中間計算過程和其他資料.這個幀在這裡和編譯原理中的活動紀錄的概念是差不多的.

從Java的這種配置設定機制來看,堆棧又可以這樣了解:棧(Stack)是作業系統在建立某個程序時或者線程(在支援多線程的作業系統中是線程)為這個線程建立的存儲區域,該區域具有先進後出的特性。

2)棧中的方法調用

嵌套方法的出棧和入棧示意圖:

Java記憶體管理基礎篇 - Java記憶體配置設定

上圖中描述了嵌套方法時,stack的記憶體配置設定圖,由上面可以知道,當嵌套方法調用時,嵌套越深,stack的記憶體就越晚才能釋放,是以,在實際開發過程中,不推薦大家使用遞歸來進行方法的調用,遞歸很容易導緻stack flow。

非嵌套方法的出棧入棧過程:

Java記憶體管理基礎篇 - Java記憶體配置設定

2.3 堆

每一個Java應用都唯一對應一個JVM執行個體,每一個執行個體唯一對應一個堆。應用程式在運作中所建立的所有類執行個體或數組都放在這個堆中,并由應用所有的線程共享.跟C/C++不同,Java中配置設定堆記憶體是自動初始化的。Java中所有對象的存儲空間都是在堆中配置設定的,但是這個對象的引用卻是在堆棧中配置設定,也就是說在建立一個對象時從兩個地方都配置設定記憶體,在堆中配置設定的記憶體實際建立這個對象,而在堆棧中配置設定的記憶體隻是一個指向這個堆對象的指針(引用)而已。

2.4 堆和棧的差別

【下面的部分屬于摘抄,描述比較好】

1. 棧(stack)與堆(heap)都是Java用來在Ram中存放資料的地方 。與C++不同,Java自動管理棧和堆,程式員不能直接地設定棧或堆。

2. 棧的優勢是,存取速度比堆要快 ,僅次于直接位于CPU中的寄存器。但缺點是,存在棧中的資料大小與生存期必須是确定的,缺乏靈活性。另外,棧資料可以共享,詳見第3點。堆的優勢是可以動态地配置設定記憶體大小,生存期也不必事先告訴編譯器,Java的垃圾收集器會自動收走這些不再使用的資料。但缺點是,由于要在運作時動态配置設定記憶體,存取速度較慢。

3. Java中的資料類型有兩種:  

    一種是基本類型(primitive types), 共有8種,即int, short, long, byte, float, double, boolean, char(注意,并沒有string的基本類型)。這種類型的定義是通過諸如int a = 3; long b = 255L;的形式來定義的,稱為自動變量。值得注意的是,自動變量存的是字面值,不是類的執行個體,即不是類的引用,這裡并沒有類的存在。如int a = 3; 這裡的a是一個指向int類型的引用,指向3這個字面值。這些字面值的資料,由于大小可知,生存期可知(這些字面值固定定義在某個程式塊裡面,程式塊退出後,字段值就消失了),出于追求速度的原因,就存在于棧中。

另外,棧有一個很重要的特殊性,就是存在棧中的資料可以共享。假設我們同時定義:

    int a = 3;

    int b = 3;

編譯器先處理int a = 3;首先它會在棧中建立一個變量為a的引用,然後查找有沒有字面值為3的位址,沒找到,就開辟一個存放3這個字面值的位址,然後将a指向3的位址。接着處理int b = 3;在建立完b的引用變量後,由于在棧中已經有3這個字面值,便将b直接指向3的位址。這樣,就出現了a與b同時均指向3的情況。

    特别注意的是,這種字面值的引用與類對象的引用不同。假定兩個類對象的引用同時指向一個對象,如果一個對象引用變量修改了這個對象的内部狀态,那麼另一個對象引用變量也即刻反映出這個變化。相反,通過字面值的引用來修改其值,不會導緻另一個指向此字面值的引用的值也跟着改變的情況。如上例,我們定義完a與b的值後,再令a=4;那麼,b不會等于4,還是等于3。在編譯器内部,遇到a=4;時,它就會重新搜尋棧中是否有4的字面值,如果沒有,重新開辟位址存放4的值;如果已經有了,則直接将a指向這個位址。是以a值的改變不會影響到b的值。

    另一種是包裝類資料 ,如Integer, String, Double等将相應的基本資料類型包裝起來的類。這些類資料全部存在于堆中,Java用new()語句來顯示地告訴編譯器,在運作時才根據需要動态建立,是以比較靈活,但缺點是要占用更多的時間。

4. String是一個特殊的包裝類資料 。即可以用String str = new String("abc");的形式來建立,也可以用String str = "abc";的形式來建立(作為對比,在JDK 5.0之前,你從未見過Integer i = 3;的表達式,因為類與字面值是不能通用的,除了String。而在JDK 5.0中,這種表達式是可以的!因為編譯器在背景進行Integer i = new Integer(3)的轉換)。前者是規範的類的建立過程,即在Java中,一切都是對象,而對象是類的執行個體,全部通過new()的形式來建立。Java中的有些類,如DateFormat類,可以通過該類的getInstance()方法來傳回一個新建立的類,似乎違反了此原則。其實不然。該類運用了單例模式來傳回類的執行個體,隻不過這個執行個體是在該類内部通過new()來建立的,而getInstance()向外部隐藏了此細節。那為什麼在String str = "abc";中,并沒有通過new()來建立執行個體,是不是違反了上述原則?其實沒有。

5. 關于String str = "abc"的内部工作。

Java内部将此語句轉化為以下幾個步驟:

(1)先定義一個名為str的對String類的對象引用變量:String str;

(2)在棧中查找有沒有存放值為"abc"的位址,如果沒有,則開辟一個存放字面值為"abc"的位址,接着建立一個新的String類的對象o,并将o的字元串值指向這個位址,而且在棧中這個位址旁邊記下這個引用的對象o。如果已經有了值為"abc"的位址,則查找對象o,并傳回o的位址。

(3)将str指向對象o的位址。

    值得注意的是,一般String類中字元串值都是直接存值的。但像String str = "abc";這種場合下,其字元串值卻是儲存了一個指向存在棧中資料的引用!

   為了更好地說明這個問題,我們可以通過以下的幾個代碼進行驗證。

   String str1 = "abc";

   String str2 = "abc";

   System.out.println(str1==str2); //true

注意,我們這裡并不用str1.equals(str2);的方式,因為這将比較兩個字元串的值是否相等。“==”号,根據JDK的說明,隻有在兩個引用都指向了同一個對象時才傳回真值。而我們在這裡要看的是,str1與str2是否都指向了同一個對象。結果說明,JVM建立了兩個引用str1和str2,但隻建立了一個對象,而且兩個引用都指向了這個對象。

    我們再來更進一步,将以上代碼改成:

    String str1 = "abc";

    String str2 = "abc";

    str1 = "bcd";

    System.out.println(str1 + "," + str2); //bcd, abc

    System.out.println(str1==str2); //false

這就是說,指派的變化導緻了類對象引用的變化,str1指向了另外一個新對象!而str2仍舊指向原來的對象。上例中,當我們将str1的值改為"bcd"時,JVM發現在棧中沒有存放該值的位址,便開辟了這個位址,并建立了一個新的對象,其字元串的值指向這個位址。

事實上,String類被設計成為不可改變(immutable)的類。如果你要改變其值,可以,但JVM在運作時根據新值悄悄建立了一個新對象,然後将這個對象的位址傳回給原來類的引用。這個建立過程雖說是完全自動進行的,但它畢竟占用了更多的時間。在對時間要求比較敏感的環境中,會帶有一定的不良影響。

    再修改原來代碼:

    String str1 = "abc";

    String str2 = "abc";

    str1 = "bcd";

    String str3 = str1;

    System.out.println(str3); //bcd

    String str4 = "bcd";

    System.out.println(str1 == str4); //true

str3這個對象的引用直接指向str1所指向的對象(注意,str3并沒有建立新對象)。當str1改完其值後,再建立一個String的引用str4,并指向因str1修改值而建立的新的對象。可以發現,這回str4也沒有建立新的對象,進而再次實作棧中資料的共享。

    我們再接着看以下的代碼。

    String str1 = new String("abc");

    String str2 = "abc";

    System.out.println(str1==str2); //false

建立了兩個引用。建立了兩個對象。兩個引用分别指向不同的兩個對象。

String str1 = "abc";

String str2 = new String("abc");

System.out.println(str1==str2); //false

建立了兩個引用。建立了兩個對象。兩個引用分别指向不同的兩個對象。

以上兩段代碼說明,隻要是用new()來建立對象的,都會在堆中建立,而且其字元串是單獨存值的,即使與棧中的資料相同,也不會與棧中的資料共享。

6. 資料類型包裝類的值不可修改。不僅僅是String類的值不可修改,所有的資料類型包裝類都不能更改其内部的值。

7. 結論與建議:

(1)我們在使用諸如String str = "abc";的格式定義類時,總是想當然地認為,我們建立了String類的對象str。擔心陷阱!對象可能并沒有被建立!唯一可以肯定的是,指向String類的引用被建立了。至于這個引用到底是否指向了一個新的對象,必須根據上下文來考慮,除非你通過new()方法來顯要地建立一個新的對象。是以,更為準确的說法是,我們建立了一個指向String類的對象的引用變量str,這個對象引用變量指向了某個值為"abc"的String類。清醒地認識到這一點對排除程式中難以發現的bug是很有幫助的。

(2)使用String str = "abc";的方式,可以在一定程度上提高程式的運作速度,因為JVM會自動根據棧中資料的實際情況來決定是否有必要建立新對象。而對于String str = new String("abc");的代碼,則一概在堆中建立新對象,而不管其字元串值是否相等,是否有必要建立新對象,進而加重了程式的負擔。這個思想應該是享元模式的思想,但JDK的内部在這裡實作是否應用了這個模式,不得而知。

(3)當比較包裝類裡面的數值是否相等時,用equals()方法;當測試兩個包裝類的引用是否指向同一個對象時,用“==”。

(4)由于String類的immutable性質,當String變量需要經常變換其值時,應該考慮使用StringBuffer類,以提高程式效率。

2.5 方法區

JVM有一個被所有的線程共享方法區。方法區類似于傳統語言的編譯後代碼的存儲區,或者UNIX程序中的text段。它存儲每個類結構例如常量池(constant pool),成員字段域和方法和構造函數,包含類和執行個體初始化和接口類型類型中用到的特殊方法的代碼。

方法區在虛拟機啟動時建立。盡管方法區在邏輯上時heap的一部分,簡單的實作仍然可以選擇對它既不回收也不壓縮。