代碼優化的最重要的作用應該是:避免未知的錯誤。在代碼上線運作的過程中,往往會出現很多我們意想不到的錯誤,因為線上環境和開發環境是非常不同的,錯誤定位到最後往往是一個非常小的原因。然而為了解決這個錯誤,我們需要先自驗證、再打包出待替換的class檔案、暫停業務并重新開機,對于一個成熟的項目而言,最後一條其實影響是非常大的,這意味着這段時間使用者無法通路應用。是以,在寫代碼的時候,從源頭開始注意各種細節,權衡并使用最優的選擇,将會很大程度上避免出現未知的錯誤,從長遠看也極大的降低了工作量。
代碼優化的目标是:
1、減小代碼的體積
2、提高代碼運作的效率
代碼優化細節
(1)盡量指定類、方法的final修飾符
帶有final修飾符的類是不可派生的。在Java核心API中,有許多應用final的例子,例如java.lang.String,整個類都是final的。為類指定final修飾符可以讓類不可以被繼承,為方法指定final修飾符可以讓方法不可以被重寫。如果指定了一個類為final,則該類所有的方法都是final的。Java編譯器會尋找機會内聯所有的final方法,内聯對于提升Java運作效率作用重大,具體參見Java運作期優化。此舉能夠使性能平均提高50%。
(2)盡量重用對象
特别是String對象的使用,出現字元串連接配接時應該使用StringBuilder/StringBuffer代替。由于Java虛拟機不僅要花時間生成對象,以後可能還需要花時間對這些對象進行垃圾回收和處理,是以,生成過多的對象将會給程式的性能帶來很大的影響。
(3)盡可能使用局部變量
調用方法時傳遞的參數以及在調用中建立的臨時變量都儲存在棧中,速度較快,其他變量,如靜态變量、執行個體變量等,都在堆中建立,速度較慢。另外,棧中建立的變量,随着方法的運作結束,這些内容就沒了,不需要額外的垃圾回收。
(4)及時關閉流
Java程式設計過程中,進行資料庫連接配接、I/O流操作時務必小心,在使用完畢後,及時關閉以釋放資源。因為對這些大對象的操作會造成系統大的開銷,稍有不慎,将會導緻嚴重的後果。
(5)盡量減少對變量的重複計算
明确一個概念,對方法的調用,即使方法中隻有一句語句,也是有消耗的,包括建立棧幀、調用方法時保護現場、調用方法完畢時恢複現場等。是以例如下面的操作:
for (int i = 0; i < list.size(); i++)
{...}
建議替換為:
for (int i = 0, length = list.size(); i < length; i++)
{...}
這樣,在list.size()很大的時候,就減少了很多的消耗
(6)盡量采用懶加載的政策,即在需要的時候才建立
例如:
String str = "aaa";
if (i == 1)
{
list.add(str);
}
if (i == 1)
{
String str = "aaa";
list.add(str);
}
(7)慎用異常
異常對性能不利。抛出異常首先要建立一個新的對象,Throwable接口的構造函數調用名為fillInStackTrace()的本地同步方法,fillInStackTrace()方法檢查堆棧,收集調用跟蹤資訊。隻要有異常被抛出,Java虛拟機就必須調整調用堆棧,因為在處理過程中建立了一個新的對象。異常隻能用于錯誤處理,不應該用來控制程式流程。
(8)不要在循環中使用try…catch…,應該把其放在最外層
根據網友們提出的意見,這一點我認為值得商榷
(9)如果能估計到待添加的内容長度,為底層以數組方式實作的集合、工具類指定初始長度
比如ArrayList、LinkedLlist、StringBuilder、StringBuffer、HashMap、HashSet等等,以StringBuilder為例:
StringBuilder() // 預設配置設定16個字元的空間
StringBuilder(int size) // 預設配置設定size個字元的空間
StringBuilder(String str) // 預設配置設定16個字元+str.length()個字元空間
可以通過類(這裡指的不僅僅是上面的StringBuilder)的構造函數來設定它的初始化容量,這樣可以明顯地提升性能。比如StringBuilder吧,length表示目前的StringBuilder能保持的字元數量。因為當StringBuilder達到最大容量的時候,它會将自身容量增加到目前的2倍再加2,無論何時隻要StringBuilder達到它的最大容量,它就不得不建立一個新的字元數組然後将舊的字元數組内容拷貝到新字元數組中—-這是十分耗費性能的一個操作。試想,如果能預估到字元數組中大概要存放5000個字元而不指定長度,最接近5000的2次幂是4096,每次擴容加的2不管,那麼:
在4096 的基礎上,再申請8194個大小的字元數組,加起來相當于一次申請了12290個大小的字元數組,如果一開始能指定5000個大小的字元數組,就節省了一倍以上的空間
把原來的4096個字元拷貝到新的的字元數組中去
這樣,既浪費記憶體空間又降低代碼運作效率。是以,給底層以數組實作的集合、工具類設定一個合理的初始化容量是錯不了的,這會帶來立竿見影的效果。但是,注意,像HashMap這種是以數組+連結清單實作的集合,别把初始大小和你估計的大小設定得一樣,因為一個table上隻連接配接一個對象的可能性幾乎為0。初始大小建議設定為2的N次幂,如果能估計到有2000個元素,設定成new HashMap(128)、new HashMap(256)都可以。
(10)當複制大量資料時,使用System.arraycopy()指令
(11)乘法和除法使用移位操作
for (val = 0; val < 100000; val += 5)
{
a = val * 8;
b = val / 2;
}
用移位操作可以極大地提高性能,因為在計算機底層,對位的操作是最友善、最快的,是以建議修改為:
for (val = 0; val < 100000; val += 5)
{
a = val << 3;
b = val >> 1;
}
移位操作雖然快,但是可能會使代碼不太好了解,是以最好加上相應的注釋。
(12)循環内不要不斷建立對象引用
for (int i = 1; i <= count; i++)
{
Object obj = new Object();
}
這種做法會導緻記憶體中有count份Object對象引用存在,count很大的話,就耗費記憶體了,建議為改為:
Object obj = null;
for (int i = 0; i <= count; i++)
{
obj = new Object();
}
這樣的話,記憶體中隻有一份Object對象引用,每次new Object()的時候,Object對象引用指向不同的Object罷了,但是記憶體中隻有一份,這樣就大大節省了記憶體空間了。
(13)基于效率和類型檢查的考慮,應該盡可能使用array,無法确定數組大小時才使用ArrayList
(14)盡量使用HashMap、ArrayList、StringBuilder,除非線程安全需要,否則不推薦使用Hashtable、Vector、StringBuffer,後三者由于使用同步機制而導緻了性能開銷
(15)不要将數組聲明為public static final
因為這毫無意義,這樣隻是定義了引用為static final,數組的内容還是可以随意改變的,将數組聲明為public更是一個安全漏洞,這意味着這個數組可以被外部類所改變
(16)盡量在合适的場合使用單例
使用單例可以減輕加載的負擔、縮短加載的時間、提高加載的效率,但并不是所有地方都适用于單例,簡單來說,單例主要适用于以下三個方面:
控制資源的使用,通過線程同步來控制資源的并發通路
控制執行個體的産生,以達到節約資源的目的
控制資料的共享,在不建立直接關聯的條件下,讓多個不相關的程序或線程之間實作通信
(17)盡量避免随意使用靜态變量
要知道,當某個對象被定義為static的變量所引用,那麼gc通常是不會回收這個對象所占有的堆記憶體的,如:
public class A
{
private static B b = new B();
}
此時靜态變量b的生命周期與A類相同,如果A類不被解除安裝,那麼引用B指向的B對象會常駐記憶體,直到程式終止
(18)及時清除不再需要的會話
為了清除不再活動的會話,許多應用伺服器都有預設的會話逾時時間,一般為30分鐘。當應用伺服器需要儲存更多的會話時,如果記憶體不足,那麼作業系統會把部分資料轉移到磁盤,應用伺服器也可能根據MRU(最近最頻繁使用)算法把部分不活躍的會話轉儲到磁盤,甚至可能抛出記憶體不足的異常。如果會話要被轉儲到磁盤,那麼必須要先被序列化,在大規模叢集中,對對象進行序列化的代價是很昂貴的。是以,當會話不再需要時,應當及時調用HttpSession的invalidate()方法清除會話。
(19)實作RandomAccess接口的集合比如ArrayList,應當使用最普通的for循環而不是foreach循環來周遊
這是JDK推薦給使用者的。JDK API對于RandomAccess接口的解釋是:實作RandomAccess接口用來表明其支援快速随機通路,此接口的主要目的是允許一般的算法更改其行為,進而将其應用到随機或連續通路清單時能提供良好的性能。實際經驗表明,實作RandomAccess接口的類執行個體,假如是随機通路的,使用普通for循環效率将高于使用foreach循環;反過來,如果是順序通路的,則使用Iterator會效率更高。可以使用類似如下的代碼作判斷:
if (list instanceof RandomAccess)
{
for (int i = 0; i < list.size(); i++){}
}
else
{
Iterator<?> iterator = list.iterable();
while (iterator.hasNext()){iterator.next()}
}
foreach循環的底層實作原理就是疊代器Iterator,參見Java文法糖1:可變長度參數以及foreach循環原理。是以後半句”反過來,如果是順序通路的,則使用Iterator會效率更高”的意思就是順序通路的那些類執行個體,使用foreach循環去周遊。
(20)使用同步代碼塊替代同步方法
這點在多線程子產品中的synchronized鎖方法塊一文中已經講得很清楚了,除非能确定一整個方法都是需要進行同步的,否則盡量使用同步代碼塊,避免對那些不需要進行同步的代碼也進行了同步,影響了代碼執行效率。
(21)将常量聲明為static final,并以大寫命名
這樣在編譯期間就可以把這些内容放入常量池中,避免運作期間計算生成常量的值。另外,将常量的名字以大寫命名也可以友善區分出常量與變量
(22)不要建立一些不使用的對象,不要導入一些不使用的類
這毫無意義,如果代碼中出現”The value of the local variable i is not used”、”The import java.util is never used”,那麼請删除這些無用的内容
(23)程式運作過程中避免使用反射
關于,請參見反射。反射是Java提供給使用者一個很強大的功能,功能強大往往意味着效率不高。不建議在程式運作過程中使用尤其是頻繁使用反射機制,特别是Method的invoke方法,如果确實有必要,一種建議性的做法是将那些需要通過反射加載的類在項目啟動的時候通過反射執行個體化出一個對象并放入記憶體—-使用者隻關心和對端互動的時候擷取最快的響應速度,并不關心對端的項目啟動花多久時間。
(24)使用資料庫連接配接池和線程池
這兩個池都是用于重用對象的,前者可以避免頻繁地打開和關閉連接配接,後者可以避免頻繁地建立和銷毀線程
(25)使用帶緩沖的輸入輸出流進行IO操作
帶緩沖的輸入輸出流,即BufferedReader、BufferedWriter、BufferedInputStream、BufferedOutputStream,這可以極大地提升IO效率
(26)順序插入和随機通路比較多的場景使用ArrayList,元素删除和中間插入比較多的場景使用LinkedList
這個,了解ArrayList和LinkedList的原理就知道了
(27)不要讓public方法中有太多的形參
public方法即對外提供的方法,如果給這些方法太多形參的話主要有兩點壞處:
違反了面向對象的程式設計思想,Java講求一切都是對象,太多的形參,和面向對象的程式設計思想并不契合
參數太多勢必導緻方法調用的出錯機率增加
至于這個”太多”指的是多少個,3、4個吧。比如我們用JDBC寫一個insertStudentInfo方法,有10個學生資訊字段要插如Student表中,可以把這10個參數封裝在一個實體類中,作為insert方法的形參
(28)字元串變量和字元串常量equals的時候将字元串常量寫在前面
這是一個比較常見的小技巧了,如果有以下代碼:
String str = "123";
if (str.equals("123"))
{
...
}
建議修改為:
String str = "123";
if ("123".equals(str))
{
...
}
這麼做主要是可以避免空指針異常
(29)請知道,在java中if (i == 1)和if (1 == i)是沒有差別的,但從閱讀習慣上講,建議使用前者
平時有人問,”if (i==1)”和”if(1==i)”有沒有差別,這就要從C/C++講起。
在C/C++中,”if (i==1)”判斷條件成立,是以0與非0為基準的,0表示false,非0表示true,如果有這麼一段代碼:
int i = 2;
if (i == 1)
{
...
}
else
{
...
}
C/C++判斷”i==1”不成立,是以以0表示,即false。但是如果:
int i = 2;
if (i = 1)
{
...
}
else
{
...
}
萬一程式員一個不小心,把”if(i==1)”寫成”if(i=1)”,這樣就有問題了。在if之内将i指派為1,if判斷裡面的内容非0,傳回的就是true了,但是明明i為2,比較的值是1,應該傳回的false。這種情況在C/C++的開發中是很可能發生的并且會導緻一些難以了解的錯誤産生,是以,為了避免開發者在if語句中不正确的指派操作,建議将if語句寫為:
int i = 2;
if (1 == i)
{
...
}
else
{
...
}
這樣,即使開發者不小心寫成了”1=i”,C/C++編譯器也可以第一時間檢查出來,因為我們可以對一個變量指派i為1,但是不能對一個常量指派1為i。
但是,在Java中,C/C++這種”if(i=1)”的文法是不可能出現的,因為一旦寫了這種文法,Java就會編譯報錯”Type mismatch: cannot convert from int to boolean”。但是,盡管Java的”if (i == 1)”和”if (1 == i)”在語義上沒有任何差別,從閱讀習慣上講,建議使用前者會更好些。
(30)不要對數組使用toString()方法
看一下對數組使用toString()列印出來的是什麼:
public static void main(String[] args)
{
int[] is = new int[]{1, 2, 3};
System.out.println(is.toString());
}
public static void main(String[] args)
{
int[] is = new int[]{1, 2, 3};
System.out.println(is.toString());
}
結果是:
[I@18a992f
本意是想列印出數組内容,卻有可能因為數組引用is為空而導緻空指針異常。不過雖然對數組toString()沒有意義,但是對集合toString()是可以列印出集合裡面的内容的,因為集合的父類AbstractCollections重寫了Object的toString()方法。
(31)不要對超出範圍的基本資料類型做向下強制轉型
這絕不會得到想要的結果:
public static void main(String[] args)
{
long l = 12345678901234L;
int i = (int)l;
System.out.println(i);
}
我們可能期望得到其中的某幾位,但是結果卻是:
1942892530
解釋一下。Java中long是8個位元組64位的,是以12345678901234在計算機中的表示應該是:
0000 0000 0000 0000 0000 1011 0011 1010 0111 0011 1100 1110 0010 1111 1111 0010
一個int型資料是4個位元組32位的,從低位取出上面這串二進制資料的前32位是:
0111 0011 1100 1110 0010 1111 1111 0010
這串二進制表示為十進制1942892530,是以就是我們上面的控制台上輸出的内容。從這個例子上還能順便得到兩個結論:
1、整型預設的資料類型是int,long l = 12345678901234L,這個數字已經超出了int的範圍了,是以最後有一個L,表示這是一個long型數。順便,浮點型的預設類型是double,是以定義float的時候要寫成”“float f = 3.5f”
2、接下來再寫一句”int ii = l + i;”會報錯,因為long + int是一個long,不能指派給int
(32)公用的集合類中不使用的資料一定要及時remove掉
如果一個集合類是公用的(也就是說不是方法裡面的屬性),那麼這個集合裡面的元素是不會自動釋放的,因為始終有引用指向它們。是以,如果公用集合裡面的某些資料不使用而不去remove掉它們,那麼将會造成這個公用集合不斷增大,使得系統有記憶體洩露的隐患。
(33)把一個基本資料類型轉為字元串,基本資料類型.toString()是最快的方式、String.valueOf(資料)次之、資料+”“最慢
把一個基本資料類型轉為一般有三種方式,我有一個Integer型資料i,可以使用i.toString()、String.valueOf(i)、i+”“三種方式,三種方式的效率如何,看一個測試:
public static void main(String[] args)
{
int loopTime = 50000;
Integer i = 0;
long startTime = System.currentTimeMillis();
for (int j = 0; j < loopTime; j++)
{
String str = String.valueOf(i);
}
System.out.println("String.valueOf():" + (System.currentTimeMillis() - startTime) + "ms");
startTime = System.currentTimeMillis();
for (int j = 0; j < loopTime; j++)
{
String str = i.toString();
}
System.out.println("Integer.toString():" + (System.currentTimeMillis() - startTime) + "ms");
startTime = System.currentTimeMillis();
for (int j = 0; j < loopTime; j++)
{
String str = i + "";
}
System.out.println("i + \"\":" + (System.currentTimeMillis() - startTime) + "ms");
}
運作結果為:
String.valueOf():11ms
Integer.toString():5ms
i + "":25ms
是以以後遇到把一個基本資料類型轉為String的時候,優先考慮使用toString()方法。至于為什麼,很簡單:
String.valueOf()方法底層調用了Integer.toString()方法,但是會在調用前做空判斷
Integer.toString()方法就不說了,直接調用了
i + “”底層使用了StringBuilder實作,先用append方法拼接,再用toString()方法擷取字元串
三者對比下來,明顯是2最快、1次之、3最慢
(34)使用最有效率的方式去周遊Map
周遊Map的方式有很多,通常場景下我們需要的是周遊Map中的Key和Value,那麼推薦使用的、效率最高的方式是:
public static void main(String[] args)
{
HashMap<String, String> hm = new HashMap<String, String>();
hm.put("111", "222");
Set<Map.Entry<String, String>> entrySet = hm.entrySet();
Iterator<Map.Entry<String, String>> iter = entrySet.iterator();
while (iter.hasNext())
{
Map.Entry<String, String> entry = iter.next();
System.out.println(entry.getKey() + "\t" + entry.getValue());
}
}
如果你隻是想周遊一下這個Map的key值,那用”Set keySet = hm.keySet();”會比較合适一些
(35)對資源的close()建議分開操作
意思是,比如我有這麼一段代碼:
try
{
XXX.close();
YYY.close();
}
catch (Exception e)
{
...
}
try
{
XXX.close();
}
catch (Exception e)
{
...
}
try
{
YYY.close();
}
catch (Exception e)
{
...
}
雖然有些麻煩,卻能避免資源洩露。我們想,如果沒有修改過的代碼,萬一XXX.close()抛異常了,那麼就進入了catch塊中了,YYY.close()不會執行,YYY這塊資源就不會回收了,一直占用着,這樣的代碼一多,是可能引起資源句柄洩露的。而改為下面的寫法之後,就保證了無論如何XXX和YYY都會被close掉
(36)對于ThreadLocal使用前或者使用後一定要先remove
目前基本所有的項目都使用了線程池技術,這非常好,可以動态配置線程數、可以重用線程。
然而,如果你在項目中使用到了ThreadLocal,一定要記得使用前或者使用後remove一下。這是因為上面提到了線程池技術做的是一個線程重用,這意味着代碼運作過程中,一條線程使用完畢,并不會被銷毀而是等待下一次的使用。我們看一下Thread類中,持有ThreadLocal.ThreadLocalMap的引用:
/* ThreadLocal values pertaining to this thread. This map is maintained
* by the ThreadLocal class. */
ThreadLocal.ThreadLocalMap threadLocals = null;
/* ThreadLocal values pertaining to this thread. This map is maintained
* by the ThreadLocal class. */
ThreadLocal.ThreadLocalMap threadLocals = null;
線程不銷毀意味着上條線程set的ThreadLocal.ThreadLocalMap中的資料依然存在,那麼在下一條線程重用這個Thread的時候,很可能get到的是上條線程set的資料而不是自己想要的内容。
這個問題非常隐晦,一旦出現這個原因導緻的錯誤,沒有相關經驗或者沒有紮實的基礎非常難發現這個問題,是以在寫代碼的時候就要注意這一點,這将給你後續減少很多的工作量。
(37)切記以常量定義的方式替代魔鬼數字,魔鬼數字的存在将極大地降低代碼可讀性,字元串常量是否使用常量定義可以視情況而定
(38)long或者Long初始指派時,使用大寫的L而不是小寫的l,因為字母l極易與數字1混淆,這個點非常細節,值得注意
(39)所有重寫的方法必須保留@Override注解
這麼做有三個原因:
(1)清楚地可以知道這個方法由父類繼承而來
(2)getObject()和get0bject()方法,前者第四個字母是”O”,後者第四個子母是”0”,加了@Override注解可以馬上判斷是否重寫成功
(3)在抽象類中對方法簽名進行修改,實作類會馬上報出編譯錯誤
(40)推薦使用JDK7中新引入的Objects工具類來進行對象的equals比較,直接a.equals(b),有空指針異常的風險
(41)循環體内不要使用”+”進行字元串拼接,而直接使用StringBuilder不斷append
說一下不使用”+”進行字元串拼接的原因,假如我有一個方法:
public String appendStr(String oriStr, String... appendStrs) {
if (appendStrs == null || appendStrs.length == 0) {
return oriStr;
}
for (String appendStr : appendStrs) {
oriStr += appendStr;
}
return oriStr;
}
将這段代碼編譯之後的.class檔案,使用javap -c進行反編譯一下,截取關鍵的一部分:

意思就是每次虛拟機碰到”+”這個操作符對字元串進行拼接的時候,會new出一個StringBuilder,然後調用append方法,最後調用toString()方法轉換字元串指派給oriStr對象,即循環多少次,就會new出多少個StringBuilder()來,這對于記憶體是一種浪費。
(42)不捕獲Java類庫中定義的繼承自RuntimeException的運作時異常類
異常處理效率低,RuntimeException的運作時異常類,其中絕大多數完全可以由程式員來規避,比如:
ArithmeticException可以通過判斷除數是否為空來規避
NullPointerException可以通過判斷對象是否為空來規避
IndexOutOfBoundsException可以通過判斷數組/字元串長度來規避
ClassCastException可以通過instanceof關鍵字來規避
ConcurrentModificationException可以使用疊代器來規避
(43)避免Random執行個體被多線程使用,雖然共享該執行個體是線程安全的,但會因競争同一seed導緻的性能下降,JDK7之後,可以使用ThreadLocalRandom來擷取随機數
解釋一下競争同一個seed導緻性能下降的原因,比如,看一下Random類的nextInt()方法實作:
public int nextInt() {
return next(32);
}
調用了next(int bits)方法,這是一個受保護的方法
protected int next(int bits) {
long oldseed, nextseed;
AtomicLong seed = this.seed;
do {
oldseed = seed.get();
nextseed = (oldseed * multiplier + addend) & mask;
} while (!seed.compareAndSet(oldseed, nextseed));
return (int)(nextseed >>> (48 - bits));
}
而這邊的seed是一個全局變量:
/**
* The internal state associated with this pseudorandom number generator.
* (The specs for the methods in this class describe the ongoing
* computation of this value.)
*/
private final AtomicLong seed;
多個線程同時擷取随機數的時候,會競争同一個seed,導緻了效率的降低。
(44)靜态類、單例類、工廠類将它們的構造函數置為private
這是因為靜态類、單例類、工廠類這種類本來我們就不需要外部将它們new出來,将構造函數置為private之後,保證了這些類不會産生執行個體對象。
後記
優秀的代碼來自每一點點小小的優化,關注每一個細節,不僅僅能提升程式運作效率,同樣可以規避許多未知的問題。