天天看點

java垃圾收集算法——垃圾清理勢在必行

1.垃圾收集算法的核心思想

  Java語言建立了垃圾收集機制,用以跟蹤正在使用的對象和發現并回收不再使用(引用)的對象。該機制可以有效防範動态記憶體配置設定中可能發生的兩個危險:因記憶體垃圾過多而引發的記憶體耗盡,以及不恰當的記憶體釋放所造成的記憶體非法引用。

  垃圾收集算法的核心思想是:對虛拟機可用記憶體空間,即堆空間中的對象進行識别,如果對象正在被引用,那麼稱其為存活對象,反之,如果對象不再被引用,則為垃圾對象,可以回收其占據的空間,用于再配置設定。垃圾收集算法的選擇和垃圾收集系統參數的合理調節直接影響着系統性能,是以需要開發人員做比較深入的了解。

  2.觸發主GC(Garbage Collector)的條件

  JVM進行次GC的頻率很高,但因為這種GC占用時間極短,是以對系統産生的影響不大。更值得關注的是主GC的觸發條件,因為它對系統影響很明顯。總的來說,有兩個條件會觸發主GC:

  ①當應用程式空閑時,即沒有應用線程在運作時,GC會被調用。因為GC在優先級最低的線程中進行,是以當應用忙時,GC線程就不會被調用,但以下條件除外。

  ②Java堆記憶體不足時,GC會被調用。當應用線程在運作,并在運作過程中建立新對象,若這時記憶體空間不足,JVM就會強制地調用GC線程,以便回收記憶體用于新的配置設定。若GC一次之後仍不能滿足記憶體配置設定的要求,JVM會再進行兩次GC作進一步的嘗試,若仍無法滿足要求,則 JVM将報“out of memory”的錯誤,Java應用将停止。

  由于是否進行主GC由JVM根據系統環境決定,而系統環境在不斷的變化當中,是以主GC的運作具有不确定性,無法預計它何時必然出現,但可以确定的是對一個長期運作的應用來說,其主GC是反複進行的。

  3.減少GC開銷的措施

  根據上述GC的機制,程式的運作會直接影響系統環境的變化,進而影響GC的觸發。若不針對GC的特點進行設計和編碼,就會出現記憶體駐留等一系列負面影響。為了避免這些影響,基本的原則就是盡可能地減少垃圾和減少GC過程中的開銷。具體措施包括以下幾個方面:

  (1)不要顯式調用System.gc()

  此函數建議JVM進行主GC,雖然隻是建議而非一定,但很多情況下它會觸發主GC,進而增加主GC的頻率,也即增加了間歇性停頓的次數。

  (2)盡量減少臨時對象的使用

  臨時對象在跳出函數調用後,會成為垃圾,少用臨時變量就相當于減少了垃圾的産生,進而延長了出現上述第二個觸發條件出現的時間,減少了主GC的機會。

  (3)對象不用時最好顯式置為Null

  一般而言,為Null的對象都會被作為垃圾處理,是以将不用的對象顯式地設為Null,有利于GC收集器判定垃圾,進而提高了GC的效率。

  (4)盡量使用StringBuffer,而不用String來累加字元串(詳見blog另一篇文章JAVA中String與StringBuffer)

  由于String是固定長的字元串對象,累加String對象時,并非在一個String對象中擴增,而是重新建立新的String對象,如Str5=Str1+Str2+Str3+Str4,這條語句執行過程中會産生多個垃圾對象,因為對次作“+”操作時都必須建立新的String對象,但這些過渡對象對系統來說是沒有實際意義的,隻會增加更多的垃圾。避免這種情況可以改用StringBuffer來累加字元串,因StringBuffer是可變長的,它在原有基礎上進行擴增,不會産生中間對象。

  (5)能用基本類型如Int,Long,就不用Integer,Long對象

  基本類型變量占用的記憶體資源比相應對象占用的少得多,如果沒有必要,最好使用基本變量。

  (6)盡量少用靜态對象變量

  靜态變量屬于全局變量,不會被GC回收,它們會一直占用記憶體。

  (7)分散對象建立或删除的時間

  集中在短時間内大量建立新對象,特别是大對象,會導緻突然需要大量記憶體,JVM在面臨這種情況時,隻能進行主GC,以回收記憶體或整合記憶體碎片,進而增加主GC的頻率。集中删除對象,道理也是一樣的。它使得突然出現了大量的垃圾對象,空閑空間必然減少,進而大大增加了下一次建立新對象時強制主GC的機會。

4.gc與finalize方法

⑴gc方法請求垃圾回收

使用System.gc()可以不管JVM使用的是哪一種垃圾回收的算法,都可以請求Java的垃圾回收。需要注意的是,調用System.gc()也僅僅是一個請求。JVM接受這個消息後,并不是立即做垃圾回收,而隻是對幾個垃圾回收算法做了權重,使垃圾回收操作容易發生,或提早發生,或回收較多而已。

⑵finalize方法透視垃圾收集器的運作

在JVM垃圾收集器收集一個對象之前 ,一般要求程式調用适當的方法釋放資源,但在沒有明确釋放資源的情況下,Java提供了預設機制來終止化該對象釋放資源,這個方法就是finalize()。它的原型為:

protected void finalize() throws Throwable

在finalize()方法傳回之後,對象消失,垃圾收集開始執行。原型中的throws Throwable表示它可以抛出任何類型的異常。

是以,當對象即将被銷毀時,有時需要做一些善後工作。可以把這些操作寫在finalize()方法裡。

protected void finalize()

{

// finalization code here

}

⑶代碼示例

class Garbage

{

int index;

static int count;

Garbage()

{

count++;

System.out.println("object "+count+" construct");

setID(count);

}

void setID(int id)

{

index=id;

}

protected void finalize() //重寫finalize方法

{

System.out.println("object "+index+" is reclaimed");

}

public static void main(String[] args)

{

new Garbage();

new Garbage();

new Garbage();

new Garbage();

System.gc(); //請求運作垃圾收集器

}

}

5.Java 記憶體洩漏

由于采用了垃圾回收機制,任何不可達對象(對象不再被引用)都可以由垃圾收集線程回收。是以通常說的Java 記憶體洩漏其實是指無意識的、非故意的對象引用,或者無意識的對象保持。無意識的對象引用是指代碼的開發人員本來已經對對象使用完畢,卻因為編碼的錯誤而意外地儲存了對該對象的引用(這個引用的存在并不是編碼人員的主觀意願),進而使得該對象一直無法被垃圾回收器回收掉,這種本來以為可以釋放掉的卻最終未能被釋放的空間可以認為是被“洩漏了”。

考慮下面的程式,在ObjStack類中,使用push和pop方法來管理堆棧中的對象。兩個方法中的索引(index)用于訓示堆棧中下一個可用位置。push方法存儲對新對象的引用并增加索引值,而pop方法減小索引值并傳回堆棧最上面的元素。在main方法中,建立了容量為64的棧,并64次調用push方法向它添加對象,此時index的值為64,随後又32次調用pop方法,則index的值變為32,出棧意味着在堆棧中的空間應該被收集。但事實上,pop方法隻是減小了索引值,堆棧仍然保持着對那些對象的引用。故32個無用對象不會被GC回收,造成了記憶體滲漏。

public class ObjStack {

private Object[] stack;

private int index;

ObjStack(int indexcount) {

stack = new Object[indexcount];

index = 0;

}

public void push(Object obj) {

stack[index] = obj;

index++;

}

public Object pop() {

index--;

return stack[index];

}

}

public class Pushpop {

public static void main(String[] args) {

int i = 0;

Object tempobj;

ObjStack stack1 = new ObjStack(64);//new一個ObjStack對象,并調用有參構造函數。配置設定stack Obj數組的空間大小為64,可以存64個對象,從0開始存儲。

while (i < 64)

{

tempobj = new Object();//循環new Obj對象,把每次循環的對象一一存放在stack Obj數組中。

stack1.push(tempobj);

i++;

System.out.println("第" + i + "次進棧" + "/t");

}

while (i > 32)

{

tempobj = stack1.pop();//這裡造成了空間的浪費。

//正确的pop方法可改成如下所訓示,當引用被傳回後,堆棧删除對他們的引用,是以垃圾收集器在以後可以回收他們。

i--;

System.out.println("第" + (64 - i) + "次出棧" + "/t");

}

}

}

如何消除記憶體洩漏

雖然Java虛拟機(JVM)及其垃圾收集器(garbage collector,GC)負責管理大多數的記憶體任務,Java軟體程式中還是有可能出現記憶體洩漏。實際上,這在大型項目中是一個常見的問題。避免記憶體洩漏的第一步是要弄清楚它是如何發生的。本文介紹了編寫Java代碼的一些常見的記憶體洩漏陷阱,以及編寫不洩漏代碼的一些最佳實踐。一旦發生了記憶體洩漏,要指出造成洩漏的代碼是非常困難的。是以本文還介紹了一種新工具,用來診斷洩漏并指出根本原因。該工具的開銷非常小,是以可以使用它來尋找處于生産中的系統的記憶體洩漏。

垃圾收集器的作用

雖然垃圾收集器處理了大多數記憶體管理問題,進而使程式設計人員的生活變得更輕松了,但是程式設計人員還是可能犯錯而導緻出現記憶體問題。簡單地說,GC循環地跟蹤所有來自“根”對象(堆棧對象、靜态對象、JNI句柄指向的對象,諸如此類)的引用,并将所有它所能到達的對象标記為活動的。程式隻可以操縱這些對象;其他的對象都被删除了。因為GC使程式不可能到達已被删除的對象,這麼做就是安全的。

雖然記憶體管理可以說是自動化的,但是這并不能使程式設計人員免受思考記憶體管理問題之苦。例如,配置設定(以及釋放)記憶體總會有開銷,雖然這種開銷對程式設計人員來說是不可見的。建立了太多對象的程式将會比完成同樣的功能而建立的對象卻比較少的程式更慢一些(在其他條件相同的情況下)。

而且,與本文更為密切相關的是,如果忘記“釋放”先前配置設定的記憶體,就可能造成記憶體洩漏。如果程式保留對永遠不再使用的對象的引用,這些對象将會占用并耗盡記憶體,這是因為自動化的垃圾收集器無法證明這些對象将不再使用。正如我們先前所說的,如果存在一個對對象的引用,對象就被定義為活動的,是以不能删除。為了確定能回收對象占用的記憶體,程式設計人員必須確定該對象不能到達。這通常是通過将對象字段設定為null或者從集合(collection)中移除對象而完成的。但是,注意,當局部變量不再使用時,沒有必要将其顯式地設定為null。對這些變量的引用将随着方法的退出而自動清除。

概括地說,這就是記憶體托管語言中的記憶體洩漏産生的主要原因:保留下來卻永遠不再使用的對象引用。

典型洩漏

既然我們知道了在Java中确實有可能發生記憶體洩漏,就讓我們來看一些典型的記憶體洩漏及其原因。

全局集合

在大的應用程式中有某種全局的資料儲存庫是很常見的,例如一個JNDI樹或一個會話表。在這些情況下,必須注意管理儲存庫的大小。必須有某種機制從儲存庫中移除不再需要的資料。

這可能有多種方法,但是最常見的一種是周期性運作的某種清除任務。該任務将驗證儲存庫中的資料,并移除任何不再需要的資料。

另一種管理儲存庫的方法是使用反向連結(referrer)計數。然後集合負責統計集合中每個入口的反向連結的數目。這要求反向連結告訴集合何時會退出入口。當反向連結數目為零時,該元素就可以從集合中移除了。

緩存

緩存是一種資料結構,用于快速查找已經執行的操作的結果。是以,如果一個操作執行起來很慢,對于常用的輸入資料,就可以将操作的結果緩存,并在下次調用該操作時使用緩存的資料。

緩存通常都是以動态方式實作的,其中新的結果是在執行時添加到緩存中的。典型的算法是:

檢查結果是否在緩存中,如果在,就傳回結果。

如果結果不在緩存中,就進行計算。

将計算出來的結果添加到緩存中,以便以後對該操作的調用可以使用。

  該算法的問題(或者說是潛在的記憶體洩漏)出在最後一步。如果調用該操作時有相當多的不同輸入,就将有相當多的結果存儲在緩存中。很明顯這不是正确的方法。

為了預防這種具有潛在破壞性的設計,程式必須確定對于緩存所使用的記憶體容量有一個上限。是以,更好的算法是:

檢查結果是否在緩存中,如果在,就傳回結果。

如果結果不在緩存中,就進行計算。

如果緩存所占的空間過大,就移除緩存最久的結果。

将計算出來的結果添加到緩存中,以便以後對該操作的調用可以使用。

  通過始終移除緩存最久的結果,我們實際上進行了這樣的假設:在将來,比起緩存最久的資料,最近輸入的資料更有可能用到。這通常是一個不錯的假設。

新算法将確定緩存的容量處于預定義的記憶體範圍之内。确切的範圍可能很難計算,因為緩存中的對象在不斷變化,而且它們的引用包羅萬象。為緩存設定正确的大小是一項非常複雜的任務,需要将所使用的記憶體容量與檢索資料的速度加以平衡。

解決這個問題的另一種方法是使用java.lang.ref.SoftReference類跟蹤緩存中的對象。這種方法保證這些引用能夠被移除,如果虛拟機的記憶體用盡而需要更多堆的話。

ClassLoader

Java ClassLoader結構的使用為記憶體洩漏提供了許多可乘之機。正是該結構本身的複雜性使ClassLoader在記憶體洩漏方面存在如此多的問題。ClassLoader的特别之處在于它不僅涉及“正常”的對象引用,還涉及元對象引用,比如:字段、方法和類。這意味着隻要有對字段、方法、類或ClassLoader的對象的引用,ClassLoader就會駐留在JVM中。因為ClassLoader本身可以關聯許多類及其靜态字段,是以就有許多記憶體被洩漏了。

确定洩漏的位置

通常發生記憶體洩漏的第一個迹象是:在應用程式中出現了OutOfMemoryError。這通常發生在您最不願意它發生的生産環境中,此時幾乎不能進行調試。有可能是因為測試環境運作應用程式的方式與生産系統不完全相同,因而導緻洩漏隻出現在生産中。在這種情況下,需要使用一些開銷較低的工具來監控和查找記憶體洩漏。還需要能夠無需重新開機系統或修改代碼就可以将這些工具連接配接到正在運作的系統上。可能最重要的是,當進行分析時,需要能夠斷開工具而保持系統不受幹擾。

雖然OutOfMemoryError通常都是記憶體洩漏的信号,但是也有可能應用程式确實正在使用這麼多的記憶體;對于後者,或者必須增加JVM可用的堆的數量,或者對應用程式進行某種更改,使它使用較少的記憶體。但是,在許多情況下,OutOfMemoryError都是記憶體洩漏的信号。一種查明方法是不間斷地監控GC的活動,确定記憶體使用量是否随着時間增加。如果确實如此,就可能發生了記憶體洩漏。

來源:http://dev.chinaitzhe.com/java/2007-10/119331514912339_3.html