想要精确計算一個Java對象占用的記憶體,首先要了解Java對象的結構表示。
Java對象結構一個Java對象在Heap的表示,可以分為三部分:
- Object Header
- Class Pointer
- Fields
每個普通Java對象在堆(heap)中都有一個頭資訊(object header),頭資訊是必不可少的,記錄着對象的狀态。

32位與64位占用空間不同,在32位中:
hash(25)+age(4)+lock(3)=32bit
64位中:
unused(25+1)+hash(31)+age(4)+lock(3)=64bit
我們知道,在Java中,一切皆對象;每個類都有一個父類,
Class Pointer
就是目前對象父類的一個指針,在32位系統中,這個指針為4byte;在64位系統中,如果開啟指針壓縮(-XX:+UseCompressedOops)或者JVM堆的最大值小于32G,這個指針也是4byte,否則是8byte。
關于字段(Fields),這裡指的是類的執行個體字段;也就是說不包括靜态字段,因為這個字段是共享記憶體的,隻會存在一份。
下面以32位系統為例子,計算一下
java.lang.Integer
到底占用多大記憶體:
Object Header
和
Pointer
都是固定的,4+4=8byte;再看看字段,隻有這一個,表示數值:
/**
* The value of the <code>Integer</code>.
*
* @serial
*/
private final int value;
一個int在java中占據4byte,是以Integer的大小為4+4+4=12byte。
這個結果對嗎?不對!還有一點沒有說:
在java,對象占用的heap大小是8位對齊的
,上面的12byte沒有對齊,是以需要補位4byte。結果是16byte!
另外,在Java中還有一種特殊的對象,
數組
!沒錯,這個對象有點特殊,它比其他對象多了一個屬性:長度(length)。是以我們計算數組長度的時候,需要額外加上一個長度的字段,即一個int的大小。
例如:int[] arr = new int[10];
arr的占用heap大小為:
4(object header)+4(pointer)+4(length)+4*10(10個int大小)=52byte 由于需要8位對齊,是以最終大小為
56byte
。
節約記憶體原則
在了解了對象的記憶體使用情況後,我們可以簡單算一筆帳。一個
java.lang.Integer
占用16byte,而一個
int
占用4byte,4:1的比例!也就是說整數的類類型是基本類型記憶體的4倍!由此我們得出第一個節約記憶體的原則:
(1) 盡量使用基本類型,而不是包裝類型。
資料庫建表的時候字段類型需要仔細推敲,同樣JavaBean中的屬性字段類型也需要仔細斟酌。不要吝啬使用short,byte,boolean,如果短類型能放下資料,盡量不要使用更長的類型。一個long比一個int才多4byte,但是你要想,如果記憶體中有100W個long,那就白白浪費了約4MB空間,不要小看這一點點的空間浪費,因為随便一個跑着線上應用的JVM中,對象都能達到上千萬!記憶體是節省出來的。肥朝大神的。
(2) 斟酌字段類型,在滿足容量前提下,盡量用小字段。
你知道一個ArrayList集合,如果裡面放了10個數字,占用多少記憶體嗎?讓我們算算:
ArrayList中有兩個字段:
/**
* The array buffer into which the elements of the ArrayList are stored.
* The capacity of the ArrayList is the length of this array buffer.
*/
private transient Object[] elementData;
/**
* The size of the ArrayList (the number of elements it contains).
*
* @serial
*/
private int size;
Object Header占4byte,Pointer占4byte,一個int字段(size)占4byte,elementData數組本身占12(4+4+4),數組中10個Integer對象占10×16。是以整個集合空間大小為4+4+4+12+160=184byte。
如果我們用int[]代替集合呢,12+4×10=52byte,對其後56byte。
集合跟數組的比例是184:56,超過3:1了!
(3) 如果可能,盡量用數組,少用集合
數組中是可以使用基本類型的,但是集合中隻能放包裝類型!
如果實在需要使用集合,推薦一個比較節約記憶體的集合工具,fastutil。這裡面包含了JKD集合中絕大部分的實作,而且比較省記憶體。
小技巧
在上面的三個原則基礎上,提供兩個小技巧。
- 時間用long/int表示,不用Date或者String。
- 短字元串如果能窮舉或者轉換成ascii表示,可以用long或者int表示。
注意:小技巧跟具體的場景資料有關系,可以根據實際情況進行激進優化節省記憶體。
總結
性能和可讀性向來就有些沖突
,在這裡也是,為了節約記憶體,不得不進行取舍,代碼醜陋了一些,可讀性差了一些,還好能省下一些記憶體。上面的原則在
确實需要節約記憶體的時候
,不妨可以試試!