天天看點

volatile關鍵字解析

volatile這個關鍵字可能很多朋友都聽說過,或許也都用過。在java 5之前,它是一個備受争議的關鍵字,因為在程式中使用它往往會導緻出人意料的結果。在java 5之後,volatile關鍵字才得以重獲生機。

  volatile關鍵字雖然從字面上了解起來比較簡單,但是要用好不是一件容易的事情。由于volatile關鍵字是與java的記憶體模型有關的,是以在講述volatile關鍵之前,我們先來了解一下與記憶體模型相關的概念和知識,然後分析了volatile關鍵字的實作原理,最後給出了幾個使用volatile關鍵字的場景。

  以下是本文的目錄大綱:

  一.記憶體模型的相關概念

  二.并發程式設計中的三個概念

  三.java記憶體模型

  四..深入剖析volatile關鍵字

  五.使用volatile關鍵字的場景

  若有不正之處請多多諒解,并歡迎批評指正。

  請尊重作者勞動成果,轉載請标明原文連結:

  http://www.cnblogs.com/dolphin0520/p/3920373.html

  大家都知道,計算機在執行程式時,每條指令都是在cpu中執行的,而執行指令過程中,勢必涉及到資料的讀取和寫入。由于程式運作過程中的臨時資料是存放在主存(實體記憶體)當中的,這時就存在一個問題,由于cpu執行速度很快,而從記憶體讀取資料和向記憶體寫入資料的過程跟cpu執行指令的速度比起來要慢的多,是以如果任何時候對資料的操作都要通過和記憶體的互動來進行,會大大降低指令執行的速度。是以在cpu裡面就有了高速緩存。

  也就是,當程式在運作過程中,會将運算需要的資料從主存複制一份到cpu的高速緩存當中,那麼cpu進行計算時就可以直接從它的高速緩存讀取資料和向其中寫入資料,當運算結束之後,再将高速緩存中的資料重新整理到主存當中。舉個簡單的例子,比如下面的這段代碼:

1

<code>i = i + </code><code>1</code><code>;</code>

   當線程執行這個語句時,會先從主存當中讀取i的值,然後複制一份到高速緩存當中,然後cpu執行指令對i進行加1操作,然後将資料寫入高速緩存,最後将高速緩存中i最新的值重新整理到主存當中。

  這個代碼在單線程中運作是沒有任何問題的,但是在多線程中運作就會有問題了。在多核cpu中,每條線程可能運作于不同的cpu中,是以每個線程運作時有自己的高速緩存(對單核cpu來說,其實也會出現這種問題,隻不過是以線程排程的形式來分别執行的)。本文我們以多核cpu為例。

  比如同時有2個線程執行這段代碼,假如初始時i的值為0,那麼我們希望兩個線程執行完之後i的值變為2。但是事實會是這樣嗎?

  可能存在下面一種情況:初始時,兩個線程分别讀取i的值存入各自所在的cpu的高速緩存當中,然後線程1進行加1操作,然後把i的最新值1寫入到記憶體。此時線程2的高速緩存當中i的值還是0,進行加1操作之後,i的值為1,然後線程2把i的值寫入記憶體。

  最終結果i的值是1,而不是2。這就是著名的緩存一緻性問題。通常稱這種被多個線程通路的變量為共享變量。

  也就是說,如果一個變量在多個cpu中都存在緩存(一般在多線程程式設計時才會出現),那麼就可能存在緩存不一緻的問題。

  為了解決緩存不一緻性問題,通常來說有以下2種解決方法:

  1)通過在總線加lock#鎖的方式

  2)通過緩存一緻性協定

  這2種方式都是硬體層面上提供的方式。

  在早期的cpu當中,是通過在總線上加lock#鎖的形式來解決緩存不一緻的問題。因為cpu和其他部件進行通信都是通過總線來進行的,如果對總線加lock#鎖的話,也就是說阻塞了其他cpu對其他部件通路(如記憶體),進而使得隻能有一個cpu能使用這個變量的記憶體。比如上面例子中 如果一個線程在執行 i = i +1,如果在執行這段代碼的過程中,在總線上發出了lcok#鎖的信号,那麼隻有等待這段代碼完全執行完畢之後,其他cpu才能從變量i所在的記憶體讀取變量,然後進行相應的操作。這樣就解決了緩存不一緻的問題。

  但是上面的方式會有一個問題,由于在鎖住總線期間,其他cpu無法通路記憶體,導緻效率低下。

  是以就出現了緩存一緻性協定。最出名的就是intel 的mesi協定,mesi協定保證了每個緩存中使用的共享變量的副本是一緻的。它核心的思想是:當cpu寫資料時,如果發現操作的變量是共享變量,即在其他cpu中也存在該變量的副本,會發出信号通知其他cpu将該變量的緩存行置為無效狀态,是以當其他cpu需要讀取這個變量時,發現自己緩存中緩存該變量的緩存行是無效的,那麼它就會從記憶體重新讀取。

volatile關鍵字解析

  在并發程式設計中,我們通常會遇到以下三個問題:原子性問題,可見性問題,有序性問題。我們先看具體看一下這三個概念:

1.原子性

  原子性:即一個操作或者多個操作 要麼全部執行并且執行的過程不會被任何因素打斷,要麼就都不執行。

  一個很經典的例子就是銀行賬戶轉賬問題:

  比如從賬戶a向賬戶b轉1000元,那麼必然包括2個操作:從賬戶a減去1000元,往賬戶b加上1000元。

  試想一下,如果這2個操作不具備原子性,會造成什麼樣的後果。假如從賬戶a減去1000元之後,操作突然中止。然後又從b取出了500元,取出500元之後,再執行 往賬戶b加上1000元 的操作。這樣就會導緻賬戶a雖然減去了1000元,但是賬戶b沒有收到這個轉過來的1000元。

  是以這2個操作必須要具備原子性才能保證不出現一些意外的問題。

  同樣地反映到并發程式設計中會出現什麼結果呢?

  舉個最簡單的例子,大家想一下假如為一個32位的變量指派過程不具備原子性的話,會發生什麼後果?

<code>i = </code><code>9</code><code>;</code>

   假若一個線程執行到這個語句時,我暫且假設為一個32位的變量指派包括兩個過程:為低16位指派,為高16位指派。

  那麼就可能發生一種情況:當将低16位數值寫入之後,突然被中斷,而此時又有一個線程去讀取i的值,那麼讀取到的就是錯誤的資料。

2.可見性

  可見性是指當多個線程通路同一個變量時,一個線程修改了這個變量的值,其他線程能夠立即看得到修改的值。

  舉個簡單的例子,看下面這段代碼:

2

3

4

5

6

<code>//線程1執行的代碼</code>

<code>int</code> <code>i = </code><code>0</code><code>;</code>

<code>i = </code><code>10</code><code>;</code>

<code>//線程2執行的代碼</code>

<code>j = i;</code>

   假若執行線程1的是cpu1,執行線程2的是cpu2。由上面的分析可知,當線程1執行 i =10這句時,會先把i的初始值加載到cpu1的高速緩存中,然後指派為10,那麼在cpu1的高速緩存當中i的值變為10了,卻沒有立即寫入到主存當中。

  此時線程2執行 j = i,它會先去主存讀取i的值并加載到cpu2的緩存當中,注意此時記憶體當中i的值還是0,那麼就會使得j的值為0,而不是10.

  這就是可見性問題,線程1對變量i修改了之後,線程2沒有立即看到線程1修改的值。

3.有序性

  有序性:即程式執行的順序按照代碼的先後順序執行。舉個簡單的例子,看下面這段代碼:

<code>int</code> <code>i = </code><code>0</code><code>;              </code>

<code>boolean</code> <code>flag = </code><code>false</code><code>;</code>

<code>i = </code><code>1</code><code>;                </code><code>//語句1  </code>

<code>flag = </code><code>true</code><code>;          </code><code>//語句2</code>

   上面代碼定義了一個int型變量,定義了一個boolean類型變量,然後分别對兩個變量進行指派操作。從代碼順序上看,語句1是在語句2前面的,那麼jvm在真正執行這段代碼的時候會保證語句1一定會在語句2前面執行嗎?不一定,為什麼呢?這裡可能會發生指令重排序(instruction reorder)。

  下面解釋一下什麼是指令重排序,一般來說,處理器為了提高程式運作效率,可能會對輸入代碼進行優化,它不保證程式中各個語句的執行先後順序同代碼中的順序一緻,但是它會保證程式最終執行結果和代碼順序執行的結果是一緻的。

  比如上面的代碼中,語句1和語句2誰先執行對最終的程式結果并沒有影響,那麼就有可能在執行過程中,語句2先執行而語句1後執行。

  但是要注意,雖然處理器會對指令進行重排序,但是它會保證程式最終結果會和代碼順序執行結果相同,那麼它靠什麼保證的呢?再看下面一個例子:

<code>int</code> <code>a = </code><code>10</code><code>;    </code><code>//語句1</code>

<code>int</code> <code>r = </code><code>2</code><code>;    </code><code>//語句2</code>

<code>a = a + </code><code>3</code><code>;    </code><code>//語句3</code>

<code>r = a*a;     </code><code>//語句4</code>

   這段代碼有4個語句,那麼可能的一個執行順序是:

  

volatile關鍵字解析

  那麼可不可能是這個執行順序呢: 語句2   語句1    語句4   語句3

  不可能,因為處理器在進行重排序時是會考慮指令之間的資料依賴性,如果一個指令instruction 2必須用到instruction 1的結果,那麼處理器會保證instruction 1會在instruction 2之前執行。

  雖然重排序不會影響單個線程内程式執行的結果,但是多線程呢?下面看一個例子:

7

8

9

<code>//線程1:</code>

<code>context = loadcontext();   </code><code>//語句1</code>

<code>inited = </code><code>true</code><code>;             </code><code>//語句2</code>

<code>//線程2:</code>

<code>while</code><code>(!inited ){</code>

<code>  </code><code>sleep()</code>

<code>}</code>

<code>dosomethingwithconfig(context);</code>

   上面代碼中,由于語句1和語句2沒有資料依賴性,是以可能會被重排序。假如發生了重排序,線上程1執行過程中先執行語句2,而此是線程2會以為初始化工作已經完成,那麼就會跳出while循環,去執行dosomethingwithconfig(context)方法,而此時context并沒有被初始化,就會導緻程式出錯。

   從上面可以看出,指令重排序不會影響單個線程的執行,但是會影響到線程并發執行的正确性。

  也就是說,要想并發程式正确地執行,必須要保證原子性、可見性以及有序性。隻要有一個沒有被保證,就有可能會導緻程式運作不正确。

  在前面談到了一些關于記憶體模型以及并發程式設計中可能會出現的一些問題。下面我們來看一下java記憶體模型,研究一下java記憶體模型為我們提供了哪些保證以及在java中提供了哪些方法和機制來讓我們在進行多線程程式設計時能夠保證程式執行的正确性。

  在java虛拟機規範中試圖定義一種java記憶體模型(java memory model,jmm)來屏蔽各個硬體平台和作業系統的記憶體通路差異,以實作讓java程式在各種平台下都能達到一緻的記憶體通路效果。那麼java記憶體模型規定了哪些東西呢,它定義了程式中變量的通路規則,往大一點說是定義了程式執行的次序。注意,為了獲得較好的執行性能,java記憶體模型并沒有限制執行引擎使用處理器的寄存器或者高速緩存來提升指令執行速度,也沒有限制編譯器對指令進行重排序。也就是說,在java記憶體模型中,也會存在緩存一緻性問題和指令重排序的問題。

  java記憶體模型規定所有的變量都是存在主存當中(類似于前面說的實體記憶體),每個線程都有自己的工作記憶體(類似于前面的高速緩存)。線程對變量的所有操作都必須在工作記憶體中進行,而不能直接對主存進行操作。并且每個線程不能通路其他線程的工作記憶體。

  舉個簡單的例子:在java中,執行下面這個語句:

<code>i  = </code><code>10</code><code>;</code>

   執行線程必須先在自己的工作線程中對變量i所在的緩存行進行指派操作,然後再寫入主存當中。而不是直接将數值10寫入主存當中。

  那麼java語言 本身對 原子性、可見性以及有序性提供了哪些保證呢?

  在java中,對基本資料類型的變量的讀取和指派操作是原子性操作,即這些操作是不可被中斷的,要麼執行,要麼不執行。

  上面一句話雖然看起來簡單,但是了解起來并不是那麼容易。看下面一個例子i:

  請分析以下哪些操作是原子性操作:

<code>x = </code><code>10</code><code>;         </code><code>//語句1</code>

<code>y = x;         </code><code>//語句2</code>

<code>x++;           </code><code>//語句3</code>

<code>x = x + </code><code>1</code><code>;     </code><code>//語句4</code>

   咋一看,有些朋友可能會說上面的4個語句中的操作都是原子性操作。其實隻有語句1是原子性操作,其他三個語句都不是原子性操作。

  語句1是直接将數值10指派給x,也就是說線程執行這個語句的會直接将數值10寫入到工作記憶體中。

  語句2實際上包含2個操作,它先要去讀取x的值,再将x的值寫入工作記憶體,雖然讀取x的值以及 将x的值寫入工作記憶體 這2個操作都是原子性操作,但是合起來就不是原子性操作了。

  同樣的,x++和 x = x+1包括3個操作:讀取x的值,進行加1操作,寫入新的值。

   是以上面4個語句隻有語句1的操作具備原子性。

  也就是說,隻有簡單的讀取、指派(而且必須是将數字指派給某個變量,變量之間的互相指派不是原子操作)才是原子操作。

  不過這裡有一點需要注意:在32位平台下,對64位資料的讀取和指派是需要通過兩個操作來完成的,不能保證其原子性。但是好像在最新的jdk中,jvm已經保證對64位資料的讀取和指派也是原子性操作了。

  從上面可以看出,java記憶體模型隻保證了基本讀取和指派是原子性操作,如果要實作更大範圍操作的原子性,可以通過synchronized和lock來實作。由于synchronized和lock能夠保證任一時刻隻有一個線程執行該代碼塊,那麼自然就不存在原子性問題了,進而保證了原子性。

  對于可見性,java提供了volatile關鍵字來保證可見性。

  當一個共享變量被volatile修飾時,它會保證修改的值會立即被更新到主存,當有其他線程需要讀取時,它會去記憶體中讀取新值。

  而普通的共享變量不能保證可見性,因為普通共享變量被修改之後,什麼時候被寫入主存是不确定的,當其他線程去讀取時,此時記憶體中可能還是原來的舊值,是以無法保證可見性。

  另外,通過synchronized和lock也能夠保證可見性,synchronized和lock能保證同一時刻隻有一個線程擷取鎖然後執行同步代碼,并且在釋放鎖之前會将對變量的修改重新整理到主存當中。是以可以保證可見性。

  在java記憶體模型中,允許編譯器和處理器對指令進行重排序,但是重排序過程不會影響到單線程程式的執行,卻會影響到多線程并發執行的正确性。

  在java裡面,可以通過volatile關鍵字來保證一定的“有序性”(具體原理在下一節講述)。另外可以通過synchronized和lock來保證有序性,很顯然,synchronized和lock保證每個時刻是有一個線程執行同步代碼,相當于是讓線程順序執行同步代碼,自然就保證了有序性。

  另外,java記憶體模型具備一些先天的“有序性”,即不需要通過任何手段就能夠得到保證的有序性,這個通常也稱為 happens-before 原則。如果兩個操作的執行次序無法從happens-before原則推導出來,那麼它們就不能保證它們的有序性,虛拟機可以随意地對它們進行重排序。

  下面就來具體介紹下happens-before原則(先行發生原則):

程式次序規則:一個線程内,按照代碼順序,書寫在前面的操作先行發生于書寫在後面的操作

鎖定規則:一個unlock操作先行發生于後面對同一個鎖額lock操作

volatile變量規則:對一個變量的寫操作先行發生于後面對這個變量的讀操作

傳遞規則:如果操作a先行發生于操作b,而操作b又先行發生于操作c,則可以得出操作a先行發生于操作c

線程啟動規則:thread對象的start()方法先行發生于此線程的每個一個動作

線程中斷規則:對線程interrupt()方法的調用先行發生于被中斷線程的代碼檢測到中斷事件的發生

線程終結規則:線程中所有的操作都先行發生于線程的終止檢測,我們可以通過thread.join()方法結束、thread.isalive()的傳回值手段檢測到線程已經終止執行

對象終結規則:一個對象的初始化完成先行發生于他的finalize()方法的開始

  這8條原則摘自《深入了解java虛拟機》。

  這8條規則中,前4條規則是比較重要的,後4條規則都是顯而易見的。

  下面我們來解釋一下前4條規則:

  對于程式次序規則來說,我的了解就是一段程式代碼的執行在單個線程中看起來是有序的。注意,雖然這條規則中提到“書寫在前面的操作先行發生于書寫在後面的操作”,這個應該是程式看起來執行的順序是按照代碼順序執行的,因為虛拟機可能會對程式代碼進行指令重排序。雖然進行重排序,但是最終執行的結果是與程式順序執行的結果一緻的,它隻會對不存在資料依賴性的指令進行重排序。是以,在單個線程中,程式執行看起來是有序執行的,這一點要注意了解。事實上,這個規則是用來保證程式在單線程中執行結果的正确性,但無法保證程式在多線程中執行的正确性。

  第二條規則也比較容易了解,也就是說無論在單線程中還是多線程中,同一個鎖如果出于被鎖定的狀态,那麼必須先對鎖進行了釋放操作,後面才能繼續進行lock操作。

  第三條規則是一條比較重要的規則,也是後文将要重點講述的内容。直覺地解釋就是,如果一個線程先去寫一個變量,然後一個線程去進行讀取,那麼寫入操作肯定會先行發生于讀操作。

  第四條規則實際上就是展現happens-before原則具備傳遞性。

  在前面講述了很多東西,其實都是為講述volatile關鍵字作鋪墊,那麼接下來我們就進入主題。

1.volatile關鍵字的兩層語義

  一旦一個共享變量(類的成員變量、類的靜态成員變量)被volatile修飾之後,那麼就具備了兩層語義:

  1)保證了不同線程對這個變量進行操作時的可見性,即一個線程修改了某個變量的值,這新值對其他線程來說是立即可見的。

  2)禁止進行指令重排序。

  先看一段代碼,假如線程1先執行,線程2後執行:

<code>//線程1</code>

<code>boolean</code> <code>stop = </code><code>false</code><code>;</code>

<code>while</code><code>(!stop){</code>

<code>    </code><code>dosomething();</code>

<code>//線程2</code>

<code>stop = </code><code>true</code><code>;</code>

   這段代碼是很典型的一段代碼,很多人在中斷線程時可能都會采用這種标記辦法。但是事實上,這段代碼會完全運作正确麼?即一定會将線程中斷麼?不一定,也許在大多數時候,這個代碼能夠把線程中斷,但是也有可能會導緻無法中斷線程(雖然這個可能性很小,但是隻要一旦發生這種情況就會造成死循環了)。

  下面解釋一下這段代碼為何有可能導緻無法中斷線程。在前面已經解釋過,每個線程在運作過程中都有自己的工作記憶體,那麼線程1在運作的時候,會将stop變量的值拷貝一份放在自己的工作記憶體當中。

  那麼當線程2更改了stop變量的值之後,但是還沒來得及寫入主存當中,線程2轉去做其他事情了,那麼線程1由于不知道線程2對stop變量的更改,是以還會一直循環下去。

  但是用volatile修飾之後就變得不一樣了:

  第一:使用volatile關鍵字會強制将修改的值立即寫入主存;

  第二:使用volatile關鍵字的話,當線程2進行修改時,會導緻線程1的工作記憶體中緩存變量stop的緩存行無效(反映到硬體層的話,就是cpu的l1或者l2緩存中對應的緩存行無效);

  第三:由于線程1的工作記憶體中緩存變量stop的緩存行無效,是以線程1再次讀取變量stop的值時會去主存讀取。

  那麼線上程2修改stop值時(當然這裡包括2個操作,修改線程2工作記憶體中的值,然後将修改後的值寫入記憶體),會使得線程1的工作記憶體中緩存變量stop的緩存行無效,然後線程1讀取時,發現自己的緩存行無效,它會等待緩存行對應的主存位址被更新之後,然後去對應的主存讀取最新的值。

  那麼線程1讀取到的就是最新的正确的值。

2.volatile保證原子性嗎?

  從上面知道volatile關鍵字保證了操作的可見性,但是volatile能保證對變量的操作是原子性嗎?

  下面看一個例子:

10

11

12

13

14

15

16

17

18

19

20

21

22

23

<code>public</code> <code>class</code> <code>test {</code>

<code>    </code><code>public</code> <code>volatile</code> <code>int</code> <code>inc = </code><code>0</code><code>;</code>

<code>    </code> 

<code>    </code><code>public</code> <code>void</code> <code>increase() {</code>

<code>        </code><code>inc++;</code>

<code>    </code><code>}</code>

<code>    </code><code>public</code> <code>static</code> <code>void</code> <code>main(string[] args) {</code>

<code>        </code><code>final</code> <code>test test = </code><code>new</code> <code>test();</code>

<code>        </code><code>for</code><code>(</code><code>int</code> <code>i=</code><code>0</code><code>;i&lt;</code><code>10</code><code>;i++){</code>

<code>            </code><code>new</code> <code>thread(){</code>

<code>                </code><code>public</code> <code>void</code> <code>run() {</code>

<code>                    </code><code>for</code><code>(</code><code>int</code> <code>j=</code><code>0</code><code>;j&lt;</code><code>1000</code><code>;j++)</code>

<code>                        </code><code>test.increase();</code>

<code>                </code><code>};</code>

<code>            </code><code>}.start();</code>

<code>        </code><code>}</code>

<code>        </code> 

<code>        </code><code>while</code><code>(thread.activecount()&gt;</code><code>1</code><code>)  </code><code>//保證前面的線程都執行完</code>

<code>            </code><code>thread.yield();</code>

<code>        </code><code>system.out.println(test.inc);</code>

   大家想一下這段程式的輸出結果是多少?也許有些朋友認為是10000。但是事實上運作它會發現每次運作結果都不一緻,都是一個小于10000的數字。

  可能有的朋友就會有疑問,不對啊,上面是對變量inc進行自增操作,由于volatile保證了可見性,那麼在每個線程中對inc自增完之後,在其他線程中都能看到修改後的值啊,是以有10個線程分别進行了1000次操作,那麼最終inc的值應該是1000*10=10000。

  這裡面就有一個誤區了,volatile關鍵字能保證可見性沒有錯,但是上面的程式錯在沒能保證原子性。可見性隻能保證每次讀取的是最新的值,但是volatile沒辦法保證對變量的操作的原子性。

  在前面已經提到過,自增操作是不具備原子性的,它包括讀取變量的原始值、進行加1操作、寫入工作記憶體。那麼就是說自增操作的三個子操作可能會分割開執行,就有可能導緻下面這種情況出現:

  假如某個時刻變量inc的值為10,

  線程1對變量進行自增操作,線程1先讀取了變量inc的原始值,然後線程1被阻塞了;

  然後線程2對變量進行自增操作,線程2也去讀取變量inc的原始值,由于線程1隻是對變量inc進行讀取操作,而沒有對變量進行修改操作,是以不會導緻線程2的工作記憶體中緩存變量inc的緩存行無效,是以線程2會直接去主存讀取inc的值,發現inc的值時10,然後進行加1操作,并把11寫入工作記憶體,最後寫入主存。

  然後線程1接着進行加1操作,由于已經讀取了inc的值,注意此時線上程1的工作記憶體中inc的值仍然為10,是以線程1對inc進行加1操作後inc的值為11,然後将11寫入工作記憶體,最後寫入主存。

  那麼兩個線程分别進行了一次自增操作後,inc隻增加了1。

  解釋到這裡,可能有朋友會有疑問,不對啊,前面不是保證一個變量在修改volatile變量時,會讓緩存行無效嗎?然後其他線程去讀就會讀到新的值,對,這個沒錯。這個就是上面的happens-before規則中的volatile變量規則,但是要注意,線程1對變量進行讀取操作之後,被阻塞了的話,并沒有對inc值進行修改。然後雖然volatile能保證線程2對變量inc的值讀取是從記憶體中讀取的,但是線程1沒有進行修改,是以線程2根本就不會看到修改的值。

  根源就在這裡,自增操作不是原子性操作,而且volatile也無法保證對變量的任何操作都是原子性的。

  把上面的代碼改成以下任何一種都可以達到效果:

  采用synchronized:

volatile關鍵字解析

 view code

  采用lock:

volatile關鍵字解析

  采用atomicinteger:

volatile關鍵字解析

  在java 1.5的java.util.concurrent.atomic包下提供了一些原子操作類,即對基本資料類型的 自增(加1操作),自減(減1操作)、以及加法操作(加一個數),減法操作(減一個數)進行了封裝,保證這些操作是原子性操作。atomic是利用cas來實作原子性操作的(compare and swap),cas實際上是利用處理器提供的cmpxchg指令實作的,而處理器執行cmpxchg指令是一個原子性操作。

3.volatile能保證有序性嗎?

  在前面提到volatile關鍵字能禁止指令重排序,是以volatile能在一定程度上保證有序性。

  volatile關鍵字禁止指令重排序有兩層意思:

  1)當程式執行到volatile變量的讀操作或者寫操作時,在其前面的操作的更改肯定全部已經進行,且結果已經對後面的操作可見;在其後面的操作肯定還沒有進行;

  2)在進行指令優化時,不能将在對volatile變量通路的語句放在其後面執行,也不能把volatile變量後面的語句放到其前面執行。

  可能上面說的比較繞,舉個簡單的例子:

<code>//x、y為非volatile變量</code>

<code>//flag為volatile變量</code>

<code>x = </code><code>2</code><code>;        </code><code>//語句1</code>

<code>y = </code><code>0</code><code>;        </code><code>//語句2</code>

<code>flag = </code><code>true</code><code>;  </code><code>//語句3</code>

<code>x = </code><code>4</code><code>;         </code><code>//語句4</code>

<code>y = -</code><code>1</code><code>;       </code><code>//語句5</code>

   由于flag變量為volatile變量,那麼在進行指令重排序的過程的時候,不會将語句3放到語句1、語句2前面,也不會講語句3放到語句4、語句5後面。但是要注意語句1和語句2的順序、語句4和語句5的順序是不作任何保證的。

  并且volatile關鍵字能保證,執行到語句3時,語句1和語句2必定是執行完畢了的,且語句1和語句2的執行結果對語句3、語句4、語句5是可見的。

  那麼我們回到前面舉的一個例子:

   前面舉這個例子的時候,提到有可能語句2會在語句1之前執行,那麼久可能導緻context還沒被初始化,而線程2中就使用未初始化的context去進行操作,導緻程式出錯。

  這裡如果用volatile關鍵字對inited變量進行修飾,就不會出現這種問題了,因為當執行到語句2時,必定能保證context已經初始化完畢。

4.volatile的原理和實作機制

  前面講述了源于volatile關鍵字的一些使用,下面我們來探讨一下volatile到底如何保證可見性和禁止指令重排序的。

  下面這段話摘自《深入了解java虛拟機》:

  “觀察加入volatile關鍵字和沒有加入volatile關鍵字時所生成的彙編代碼發現,加入volatile關鍵字時,會多出一個lock字首指令”

  lock字首指令實際上相當于一個記憶體屏障(也成記憶體栅欄),記憶體屏障會提供3個功能:

  1)它確定指令重排序時不會把其後面的指令排到記憶體屏障之前的位置,也不會把前面的指令排到記憶體屏障的後面;即在執行到記憶體屏障這句指令時,在它前面的操作已經全部完成;

  2)它會強制将對緩存的修改操作立即寫入主存;

  3)如果是寫操作,它會導緻其他cpu中對應的緩存行無效。

  synchronized關鍵字是防止多個線程同時執行一段代碼,那麼就會很影響程式執行效率,而volatile關鍵字在某些情況下性能要優于synchronized,但是要注意volatile關鍵字是無法替代synchronized關鍵字的,因為volatile關鍵字無法保證操作的原子性。通常來說,使用volatile必須具備以下2個條件:

  1)對變量的寫操作不依賴于目前值

  2)該變量沒有包含在具有其他變量的不變式中

  實際上,這些條件表明,可以被寫入 volatile 變量的這些有效值獨立于任何程式的狀态,包括變量的目前狀态。

  事實上,我的了解就是上面的2個條件需要保證操作是原子性操作,才能保證使用volatile關鍵字的程式在并發時能夠正确執行。

  下面列舉幾個java中使用volatile的幾個場景。

1.狀态标記量

<code>volatile</code> <code>boolean</code> <code>flag = </code><code>false</code><code>;</code>

<code>while</code><code>(!flag){</code>

<code>public</code> <code>void</code> <code>setflag() {</code>

<code>    </code><code>flag = </code><code>true</code><code>;</code>

<code>volatile</code> <code>boolean</code> <code>inited = </code><code>false</code><code>;</code>

<code>context = loadcontext();  </code>

<code>inited = </code><code>true</code><code>;            </code>

<code>sleep()</code>

2.double check

<code>class</code> <code>singleton{</code>

<code>    </code><code>private</code> <code>volatile</code> <code>static</code> <code>singleton instance = </code><code>null</code><code>;</code>

<code>    </code><code>private</code> <code>singleton() {</code>

<code>    </code><code>public</code> <code>static</code> <code>singleton getinstance() {</code>

<code>        </code><code>if</code><code>(instance==</code><code>null</code><code>) {</code>

<code>            </code><code>synchronized</code> <code>(singleton.</code><code>class</code><code>) {</code>

<code>                </code><code>if</code><code>(instance==</code><code>null</code><code>)</code>

<code>                    </code><code>instance = </code><code>new</code> <code>singleton();</code>

<code>            </code><code>}</code>

<code>        </code><code>return</code> <code>instance;</code>

原文連結:[http://wely.iteye.com/blog/2324811]