與前面的鎖和volatile相比較,對final域的讀和寫更像是普通的變量通路。對final域,編譯器和處理器要遵守兩個重排序規則:
- 在構造函數内對一個final域的寫入,與随後把這個構造對象的引用指派給一個引用變量,這兩個操作之間不能重排序。
- 初次讀一個包含final域的對象的引用,與随後初次讀這個final域,這兩個操作之間不能重排序。
示例代碼:
public class FinalExample{
int i; //普通變量
final int j; //final變量
static FinalExample obj;
public void FinalExample(){ //構造函數
i = 1; //寫普通域
j = 2; //寫final域
}
public static void writer(){ //寫線程A執行
obj = new FinalExample();
}
public static void reader(){ //讀線程B執行
FinalExample object = obj; //讀對象引用
int a = object.i; //讀普通域
int b = object.j; //讀final域
}
}
假設線程A執行writer()方法,随後另一個線程B執行reader()方法。下面通過兩個線程的互動來說明這兩個規則。
寫final域的重排序規則
寫final域的重排序規則禁止把final域的寫重排序到構造函數外,這個規則的實作包含下面兩個方面:
- JMM禁止編譯器把final域的寫重排序到構造函數之外。
- 編譯器會在final域的寫之後,構造函數return之前,插入一個StoreStore屏障。這個屏障禁止處理器把final域的寫重排序到構造函數之外。
writer()方法中,隻包含一行代碼:finalExample = new FinalExample()。這行代碼包含兩個步驟:
- 構造一個FinalExample類型的對象;
- 把這個對象的引用指派給引用變量obj。
假設線程B讀對象引用于都對象的成員域之間沒有重排序,下圖是一種可能的執行順序:
在上圖中,寫普通域的操作被編譯器重排序到構造函數之外,讀線程B錯誤的堵到了普通變量i初始化之前的值。而寫final域的操作,被重排序規則限制在構造函數之内,讀線程B正确的讀取了final變量初始化之後的值。
寫final域的重排序規則可以確定:在對象引用為任意線程可見之前,對象的final域已經被正确初始化過了,而普通域不具有這個保障。如上圖所示的,在讀線程B“看到”對象引用obj時,很可能obj對象還沒有構造完成(普通域的寫操作被重排序到構造函數之外,此時初始值2還沒有寫入普通域i)。
讀final域的重排序規則
讀final域的重排序規則如下:
- 在一個線程中,初次讀對象引用與初次對該對象包含的final域,JMM禁止處理器重排序這兩個操作(注意,這個規則僅僅針對處理器)。編譯器會在讀final域操作的前面插入一個LoadLoad屏障。
初次讀對象引用與該對象包含final域,這兩個操作之間存在間接依賴關系。由于編譯器遵守間接依賴關系,是以編譯器不會重排序這兩個操作。大多數處理器也會遵守間接依賴關系。但有少數處理器允許對間接關系的操作做重排序(比如alpha處理器),這個規則就是專門用來針對這種處理器。
reader()方法包含三個操作:
- 初次讀引用變量obj;
- 初次讀引用變量obj指向對象的普通域j;
- 初次讀引用變量obj指向對象的final域i。
假設寫線程A沒有發生任何重排序,同僚承租在不遵守間接依賴的處理器上執行,下面是一種可能執行的時序:
在上圖中,讀對象的額普通域的操作被處理器重排序到對象引用之前,讀普通域時,該域還沒有被寫線程A寫入,這是一個錯誤的讀取操作。而final域的重排序規則會把讀對象final域的操作“限定”在讀對象引用之後,此時該final域已經被A線程初始化過了,這是一個争取的讀取操作。
讀final域的重排序規則可以確定:在讀一個對象的final域之前,一定會先讀包含這個final域的對象引用。在這個示例程式中,如果該引用不為null,那麼引用對象的final域一定已經被A線程初始化過了。
如果final域是引用類型
示例代碼:
public class FinalReferenceExample{
final int [] intArray;
static FinalReferenceExample obj;
public FinalReferenceExample(){ //構造函數
intArray = new int[1]; //1
intArray[0] = 1; //2
}
public static void writerOne(){ //寫線程A執行
obj = new FinalReferenceExample(); //3
}
public static void writeTwo(){ //寫線程B執行
obj.intArray[0] = 2; //4
}
public static void reader(){ //讀線程C執行
if(obj != null){ //5
int temp1 = obj.intArray[0]; //6
}
}
}
這裡final域為一個引用類型,它引用一個int類型的數組對象。對于引用類型,寫final域的重排序規則對編譯器和處理器都加了如下限制:
- 在構造函數内對一個final引用的對象的成員域的寫入,與随後在構造函數外把這個被構造對象的引用指派給一個引用變量,這兩個操作之間不能重排序。
假設上面程式中線程A執行writeOne()方法,接着線程B執行writeTwo()方法,執行完後線程C執行reader()方法。下面是一種可能執行的線程時序:
上圖中,1是對final域的寫入,2是對這個final域引用的對象的成員域的寫入,3是把被構造的對象的引用指派給某個引用變量。這裡除了前面提到的1不能和3重排序外,2和3也不能重排序。
JMM可以確定讀線程C至少能看到寫線程A在構造函數中對final引用對象的成員域的寫入。即C至少能看到數組下标0的值為1.兒寫線程B對數組的寫入,線程C不一定能看到。JMM不保證B的寫入對讀線程C可見,因為寫線程B和讀線程C之間存在資料競争,此時的執行結果不可預知。
如果想要確定讀線程C卡到寫線程B對數組元素的寫入,寫線程B和讀線程C之間需要使用同步原語(lock和volatile)來確定記憶體可見性。
為什麼final引用不能從構造函數内“逸出”
寫final域的重排序規則可以確定:在引用變量為任意線程可見之前,該引用變量指向的對象的final域已經在構造函數中被正确初始化過了。其實要想得到這個效果,還需要一個保證:在構造函數内部,不能讓這個被構造對象的引用為其他線程可見,也就是對象引用不能再構造函數中“逸出”。示例代碼:
public class FinalReferenceEscapeExample{
final int i;
static FinalReferenceEscapeExample obj;
public FinalReferenceEscapeExample(){
i = 1; //1寫final域
obj = this; //2 this引用在此“逸出”
}
publicstatic void writer(){
new FinalReferenceEscapeExample();
}
public static void reader(){
if(obj != null){ //3
int temp = obj.i; //4
}
}
}
假設線程A執行writer()方法,随後另一個線程B執行reader()方法。這裡的操作2使得對象還未完成構造前就為線程B可見。即使這裡的操作2是構造函數的最後一步,且即使在程式中操作2排在操作1後面,執行read()方法的線程仍然可能無法看到final域被初始化後的值,因為這裡的操作1和操作2之間可能被重排序。實際執行時序可能如下:
由圖可知:在構造函數傳回前,被構造對象的引用不能為其他線程可見,因為此時final域可能還沒有被初始化。在構造函數傳回後,任意線程都講保證能看到final域正确初始化之後的值。
final語義在處理器中的實作
以x86處理器為例,說明final語義在處理器中的具體實作。
寫final域的重排序規則會要求編譯器在final域的寫之後,構造函數return之前,插入一個StoreStore屏障。
讀final域的重排序規則要求編譯器在讀final域的操作前面插入一個LoadLoad屏障。
由于x86處理器不會對寫-寫操作做重排序,是以在x86處理器中,寫final域需要的StoreStore屏障會被省略掉。同樣,由于x86處理器不會對存在間接依賴關系的操作做重排序,是以在x86處理器中,讀final域需要的LoadLoad屏障也會被省略掉。也就是說在x86處理器中,final域的讀/寫不會插入任何記憶體屏障。