天天看點

java記憶體空間

java記憶體配置設定與管理是java的核心技術之一,之前我們曾介紹過java的記憶體管理與記憶體洩露以及java垃圾回收方面的知識,今天我們再次深入java核心,詳細介紹一下java在記憶體配置設定方面的知識。一般java在記憶體配置設定時會涉及到以下區域:

◆寄存器:我們在程式中無法控制

◆棧:存放基本類型的資料和對象的引用,但對象本身不存放在棧中,而是存放在堆中

◆堆:存放用new産生的資料

◆靜态域:存放在對象中用static定義的靜态成員

◆常量池:存放常量

◆非ram存儲:硬碟等永久存儲空間

java記憶體配置設定中的棧

在函數中定義的一些基本類型的變量資料和對象的引用變量都在函數的棧記憶體中配置設定。

 當在一段代碼塊定義一個變量時,java就在棧中 為這個變量配置設定記憶體空間,當該變量退出該作用域後,java會自動釋放掉為該變量所配置設定的記憶體空間,該記憶體空間可以立即被另作他用。

java記憶體配置設定中的堆

堆記憶體用來存放由new建立的對象和數組。 在堆中配置設定的記憶體,由java虛拟機的自動垃圾回收器來管理。

在堆中産生了一個數組或對象後,還可以 在棧中定義一個特殊的變量,讓棧中這個變量的取值等于數組或對象在堆記憶體中的首位址,棧中的這個變量就成了數組或對象的引用變量。  引用變量就相當于是 為數組或對象起的一個名稱,以後就可以在程式中使用棧中的引用變量來通路堆中的數組或對象。引用變量就相當于是為數組或者對象起的一個名稱。

引用變量是普通的變量,定義時在棧中配置設定,引用變量在程式運作到其作用域之外後被釋放。而數組和對象本身在堆中配置設定,即使程式 運作到使用 new 産生數組或者對象的語句所在的代碼塊之外,數組和對象本身占據的記憶體不會被釋放,數組和對象在沒有引用變量指向它的時候,才變為垃圾,不能在被使用,但仍 然占據記憶體空間不放,在随後的一個不确定的時間被垃圾回收器收走(釋放掉)。這也是 java 比較占記憶體的原因。

實際上,棧中的變量指向堆記憶體中的變量,這就是java中的指針!

常量池 (constant pool)

常量池指的是在編譯期被确定,并被儲存在已編譯的.class檔案中的一些資料。除了包含代碼中所定義的各種基本類型(如int、long等等)和對象型(如string及數組)的常量值(final)還包含一些以文本形式出現的符号引用,比如:

◆類和接口的全限定名;

◆字段的名稱和描述符;

◆方法和名稱和描述符。

虛拟機必須為每個被裝載的類型維護一個常量池。常量池就是該類型所用到常量的一個有序集和,包括直接常量(string,integer和 floating point常量)和對其他類型,字段和方法的符号引用。

對于string常量,它的值是在常量池中的。而jvm中的常量池在記憶體當中是以表的形式存在的, 對于string類型,有一張固定長度的constant_string_info表用來存儲文字字元串值,注意:該表隻存儲文字字元串值,不存儲符号引 用。說到這裡,對常量池中的字元串值的存儲位置應該有一個比較明了的了解了。

 在程式執行的時候,常量池 會儲存在method area,而不是堆中。

堆與棧

java的堆是一個運作時資料區,類的(對象從中配置設定空間。這些對象通過new、newarray、 anewarray和multianewarray等指令建立,它們不需要程式代碼來顯式的釋放。堆是由垃圾回收來負責的,堆的優勢是可以動态地配置設定記憶體 大小,生存期也不必事先告訴編譯器,因為它是在運作時動态配置設定記憶體的,java的垃圾收集器會自動收走這些不再使用的資料。但缺點是,由于要在運作時動态 配置設定記憶體,存取速度較慢。

棧的優勢是,存取速度比堆要快,僅次于寄存器,棧資料可以共享。但缺點是,存在棧中的資料大小與生存期必須是 确定的,缺乏靈活性。棧中主要存放一些基本類型的變量資料(int, short, long, byte, float, double, boolean, char)和對象句柄(引用)。

棧有一個很重要的特殊性,就是存在棧中的資料可以共享。假設我們同時定義:

1. int a = 3;   

2. int b = 3;  

編譯器先處理int a = 3;首先它會在棧中建立一個變量為a的引用,然後查找棧中是否有3這個值,如果沒找到,就将3存放進來,然後将a指向3。接着處理int b = 3;在建立完b的引用變量後,因為在棧中已經有3這個值,便将b直接指向3。這樣,就出現了a與b同時均指向3的情況。

這時,如果再令 a=4;那麼編譯器會重新搜尋棧中是否有4值,如果沒有,則将4存放進來,并令a指向4;如果已經有了,則直接将a指向這個位址。是以a值的改變不會影響 到b的值。

要注意這種資料的共享與兩個對象的引用同時指向一個對象的這種共享是不同的,因為這種情況a的修改并不會影響到b, 它是由編譯器完成的,它有利于節省空間。而一個對象引用變量修改了這個對象的内部狀态,會影響到另一個對象引用變量。

string是一個特殊的包裝類資料。可以用:

string str = new string("abc");   

string str = "abc";  

兩種的形式來建立,第一種是用new()來建立對象的,它會在存放于堆中。每調用一次就會建立一個新的對象。而第二種是先在棧中建立一個對string類的對象引用變量str,然後通過符号引用去字元串常量池 裡找有沒有"abc",如果沒有,則将"abc"存放進字元串常量池 ,并令str指向”abc”,如果已經有”abc” 則直接令str指向“abc”。

比較類裡面的數值是否相等時,用equals()方法;當測試兩個包裝類的引用是否指向同一個對象時,用==,下面用例子說明上面的理論。

1.string str1 = "abc";   

2.string str2 = "abc";   

3.system.out.println(str1==str2); //true  

可以看出str1和str2是指向同一個對象的。

1.string str1 =new string ("abc");   

2.string str2 =new string ("abc");   

3.system.out.println(str1==str2); // false  

用new的方式是生成不同的對象。每一次生成一個。

是以用第二種方式建立多個”abc”字元串,在記憶體中 其實隻存在一個對象而已. 這種寫法有利與節省記憶體空間. 同時它可以在一定程度上提高程式的運作速度,因為jvm會自動根據棧中資料的實際情況來決定是否有必要建立新對象。而對于string str = new string("abc");的代碼,則一概在堆中建立新對象,而不管其字元串值是否相等,是否有必要建立新對象,進而加重了程式的負擔。

另 一方面, 要注意: 我們在使用諸如string str = "abc";的格式定義類時,總是想當然地認為,建立了string類的對象str。擔心陷阱!對象可能并沒有被建立!而可能隻是指向一個先前已經建立的 對象。隻有通過new()方法才能保證每次都建立一個新的對象。

 由于string類的immutable性質,當string變量需要經常變換 其值時,應該考慮使用stringbuffer類,以提高程式效率。

 1. 首先string不屬于8種基本資料類型,string是一個對象。因為對象的預設值是null,是以string的預設值也是null;但它又是一種特殊的對象,有其它對象沒有的一些特性。

2. new string()和new string("")都是申明一個新的空字元串,是空串不是null;

3. string str=”kvill”;string str=new string (”kvill”)的差別

示例:

1.string s0="kvill";   

2.string s1="kvill";   

3.string s2="kv" + "ill";   

4.system.out.println( s0==s1 );   

5.system.out.println( s0==s2 );  

結果為:

 true 

 true

首先,我們要知道結果為java 會確定一個字元串常量隻有一個拷貝。

因為例子中的 s0和s1中的”kvill”都是字元串常量,它們在編譯期就被确定了,是以s0==s1為true;而”kv”和”ill”也都是字元串常量,當一個字 符串由多個字元串常量連接配接而成時,它自己肯定也是字元串常量,是以s2也同樣在編譯期就被解析為一個字元串常量,是以s2也是常量池中” kvill”的一個引用。是以我們得出s0==s1==s2;用new string() 建立的字元串不是常量,不能在編譯期就确定,是以new string() 建立的字元串不放入常量池中,它們有自己的位址空間。

6.string s0="kvill";   

7.string s1=new string("kvill");   

8.string s2="kv" + new string("ill");   

9.system.out.println( s0==s1 );   

10.system.out.println( s0==s2 );   

11.system.out.println( s1==s2 );  

 false 

 false

例2中s0還是常量池 中"kvill”的應用,s1因為無法在編譯期确定,是以是運作時建立的新對象”kvill”的引用,s2因為有後半部分 new string(”ill”)是以也無法在編譯期确定,是以也是一個新建立對象”kvill”的應用;明白了這些也就知道為何得出此結果了。

4. string.intern():

再補充介紹一點:存在于.class檔案中的常量池,在運作期被jvm裝載,并且可以擴充。string的 intern()方法就是擴充常量池的 一個方法;當一個string執行個體str調用intern()方法時,java 查找常量池中 是否有相同unicode的字元串常量,如果有,則傳回其的引用,如果沒有,則在常 量池中增加一個unicode等于str的字元串并傳回它的引用;看示例就清楚了

1.string s0= "kvill";   

2.string s1=new string("kvill");   

3.string s2=new string("kvill");   

5.system.out.println( "**********" );   

6.s1.intern();   

7.s2=s2.intern(); //把常量池中"kvill"的引用賦給s2   

8.system.out.println( s0==s1);   

9.system.out.println( s0==s1.intern() );   

10.system.out.println( s0==s2 );  

 false //雖然執行了s1.intern(),但它的傳回值沒有賦給s1 

 true //說明s1.intern()傳回的是常量池中"kvill"的引用 

最後我再破除一個錯誤的了解:有人說,“使用 string.intern() 方法則可以将一個 string 類的儲存到一個全局 string 表中 ,如果具有相同值的 unicode 字元串已經在這個表中,那麼該方法傳回表中已有字元串的位址,如果在表中沒有相同值的字元串,則将自己的位址注冊到表中”如果我把他說的這個全局的 string 表了解為常量池的話,他的最後一句話,”如果在表中沒有相同值的字元串,則将自己的位址注冊到表中”是錯的:

1.string s1=new string("kvill");   

2.string s2=s1.intern();   

3.system.out.println( s1==s1.intern() );   

4.system.out.println( s1+" "+s2 );   

5.system.out.println( s2==s1.intern() );  

結果:

1. false 

2. kvill kvill 

3. true

在這個類中我們沒有聲名一個”kvill”常量,是以常量池中一開始是沒有”kvill”的,當我們調用s1.intern()後就在常量池中新添加了一 個”kvill”常量,原來的不在常量池中的”kvill”仍然存在,也就不是“将自己的位址注冊到常量池中”了。

s1==s1.intern() 為false說明原來的”kvill”仍然存在;s2現在為常量池中”kvill”的位址,是以有s2==s1.intern()為true。

5. 關于equals()和==:

這個對于string簡單來說就是比較兩字元串的unicode序列是否相當,如果相等傳回true;而==是 比較兩字元串的位址是否相同,也就是是否是同一個字元串的引用。

6. 關于string是不可變的

這一說又要說很多,大家隻 要知道string的執行個體一旦生成就不會再改變了,比如說:string str=”kv”+”ill”+” “+”ans”; 就是有4個字元串常量,首先”kv”和”ill”生成了”kvill”存在記憶體中,然後”kvill”又和” ” 生成 “kvill “存在記憶體中,最後又和生成了”kvill ans”;并把這個字元串的位址賦給了str,就是因為string的”不可變”産生了很多臨時變量,這也就是為什麼建議用stringbuffer的原 因了,因為stringbuffer是可改變的。

下面是一些string相關的常見問題:

string中的final用法和了解

 final stringbuffer a = new stringbuffer("111");

 final stringbuffer b = new stringbuffer("222");

 a=b;//此句編譯不通過

 a.append("222");// 編譯通過

可見,final隻對引用的"值"(即記憶體位址)有效,它迫使引用隻能指向初始指向的那個對象,改變它的指向會導緻編譯期錯誤。至于它所指向的對象 的變化,final是不負責的。

string常量池問題的幾個例子

下面是幾個常見例子的比較分析和了解:

string a = "a1";   

string b = "a" + 1;   

system.out.println((a == b)); //result = true  

string a = "atrue";   

string b = "a" + "true";   

string a = "a3.4";   

string b = "a" + 3.4;   

system.out.println((a == b)); //result = true 

分析:jvm對于字元串常量的"+"号連接配接,将程式編譯期,jvm就将常量字元串的"+"連接配接優化為連接配接後的值,拿"a" + 1來說,經編譯器優化後在class中就已經是a1。在編譯期其字元串常量的值就确定下來,故上面程式最終的結果都為true。

string a = "ab";   

string bb = "b";   

string b = "a" + bb;   

system.out.println((a == b)); //result = false 

分析:jvm對于字元串引用,由于在字元串的"+"連接配接中,有字元串引用存在,而引用的值在程式編譯期是無法确定的,即"a" + bb無法被編譯器優化,隻有在程式運作期來動态配置設定并将連接配接後的新位址賦給b。是以上面程式的結果也就為false。

final string bb = "b";   

分析:和[3]中唯一不同的是bb字元串加了final修飾,對于final修飾的變量,它在編譯時被解析為常量值的一個本地拷貝存儲到自己的常量 池中或嵌入到它的位元組碼流中。是以此時的"a" + bb和"a" + "b"效果是一樣的。故上面程式的結果為true。

final string bb = getbb();   

system.out.println((a == b)); //result = false   

private static string getbb() {  

return "b";   

分析:jvm對于字元串引用bb,它的值在編譯期無法确定,隻有在程式運作期調用方法後,将方法的傳回值和"a"來動态連接配接并配置設定位址為b,故上面 程式的結果為false。

通過上面4個例子可以得出得知:

string  s  =  "a" + "b" + "c"; 

 就等價于string s = "abc";  

 string  a  =  "a";   

 string  b  =  "b";   

 string  c  =  "c";   

 string  s  =   a  +  b  +  c; 

這個就不一樣了,最終結果等于: 

1.stringbuffer temp = new stringbuffer();     

2.temp.append(a).append(b).append(c);     

3.string s = temp.tostring(); 

由上面的分析結果,可就不難推斷出string 采用連接配接運算符(+)效率低下原因分析,形如這樣的代碼:

public class test {  

    public static void main(string args[]) {  

        string s = null;  

        for(int i = 0; i < 100; i++) {  

        s += "a";  

        }  

    }  

每做一次 + 就産生個stringbuilder對象,然後append後就扔掉。下次循環再到達時重新産生個stringbuilder對象,然後 append 字元串,如此循環直至結束。如果我們直接采用 stringbuilder 對象進行 append 的話,我們可以節省 n - 1 次建立和銷毀對象的時間。是以對于在循環中要進行字元串連接配接的應用,一般都是用stringbuffer或stringbulider對象來進行 append操作。

string對象的intern方法了解和分析:

1.public class test4 {  

2.    private static string a = "ab";   

3.    public static void main(string[] args){  

4.        string s1 = "a";  

5.        string s2 = "b";  

6.        string s = s1 + s2;  

7.        system.out.println(s == a);//false  

8.        system.out.println(s.intern() == a);//true    

9.    }  

10.} 

這裡用到java裡面是一個常量池的問題。對于s1+s2操作,其實是在堆裡面重新建立了一個新的對象,s儲存的是這個新對象在堆空間的的内容,所 以s與a的值是不相等的。而當調用s.intern()方法,卻可以傳回s在常量池中的位址值,因為a的值存儲在常量池中,故s.intern和a的值相等。

總結

棧中用來存放一些原始資料類型的局部變量資料和對象的引用(string,數組.對象等等)但不存放對象内容

堆中存放使用new關鍵字建立的對象.

字元串是一個特殊包裝類,其引用是存放在棧裡的,而對象内容必須根據建立方式不同定(常量池和堆).有的是編譯期就已經建立好,存放在字元串常 量池中,而有的是運作時才被建立.使用new關鍵字,存放在堆中。