Java線程同步機制深入闡述

我們可以在計算機上運作各種計算機軟體程式。每一個運作的程式可能包括多個獨立運作的線程（Thread）。

線程（Thread）是一份獨立運作的程式，有自己專用的運作棧。線程有可能和其他線程共享一些資源，比如，記憶體，檔案，資料庫等。

當多個線程同時讀寫同一份共享資源的時候，可能會引起沖突。這時候，我們需要引入線程“同步”機制，即各位線程之間要有個先來後到，不能一窩蜂擠上去搶作一團。

同步這個詞是從英文synchronize（使同時發生）翻譯過來的。我也不明白為什麼要用這個很容易引起誤解的詞。既然大家都這麼用，咱們也就隻好這麼将就。

線程同步的真實意思和字面意思恰好相反。線程同步的真實意思，其實是“排隊”：幾個線程之間要排隊，一個一個對共享資源進行操作，而不是同時進行操作。

是以，關于線程同步，需要牢牢記住的第一點是：線程同步就是線程排隊。同步就是排隊。線程同步的目的就是避免線程“同步”執行。這可真是個無聊的繞密碼。

關于線程同步，需要牢牢記住的第二點是 “共享”這兩個字。隻有共享資源的讀寫通路才需要同步。如果不是共享資源，那麼就根本沒有同步的必要。

關于線程同步，需要牢牢記住的第三點是，隻有“變量”才需要同步通路。如果共享的資源是固定不變的，那麼就相當于“常量”，線程同時讀取常量也不需要同步。至少一個線程修改共享資源，這樣的情況下，線程之間就需要同步。

關于線程同步，需要牢牢記住的第四點是：多個線程通路共享資源的代碼有可能是同一份代碼，也有可能是不同的代碼；無論是否執行同一份代碼，隻要這些線程的代碼通路同一份可變的共享資源，這些線程之間就需要同步。

為了加深了解，下面舉幾個例子。

有兩個采購員，他們的工作内容是相同的，都是遵循如下的步驟：

（1）到市場上去，尋找并購買有潛力的樣品。

（2）回到公司，寫報告。

這兩個人的工作内容雖然一樣，他們都需要購買樣品，他們可能買到同樣種類的樣品，但是他們絕對不會購買到同一件樣品，他們之間沒有任何共享資源。是以，他們可以各自進行自己的工作，互不幹擾。

這兩個采購員就相當于兩個線程；兩個采購員遵循相同的工作步驟，相當于這兩個線程執行同一段代碼。

下面給這兩個采購員增加一個工作步驟。采購員需要根據公司的“布告欄”上面公布的資訊，安排自己的工作計劃。

這兩個采購員有可能同時走到布告欄的前面，同時觀看布告欄上的資訊。這一點問題都沒有。因為布告欄是隻讀的，這兩個采購員誰都不會去修改布告欄上寫的資訊。

下面增加一個角色。一個辦公室行政人員這個時候，也走到了布告欄前面，準備修改布告欄上的資訊。

如果行政人員先到達布告欄，并且正在修改布告欄的内容。兩個采購員這個時候，恰好也到了。這兩個采購員就必須等待行政人員完成修改之後，才能觀看修改後的資訊。

如果行政人員到達的時候，兩個采購員已經在觀看布告欄了。那麼行政人員需要等待兩個采購員把目前資訊記錄下來之後，才能夠寫上新的資訊。

上述這兩種情況，行政人員和采購員對布告欄的通路就需要進行同步。因為其中一個線程（行政人員）修改了共享資源（布告欄）。而且我們可以看到，行政人員的工作流程和采購員的工作流程（執行代碼）完全不同，但是由于他們通路了同一份可變共享資源（布告欄），是以他們之間需要同步。

同步鎖

前面講了為什麼要線程同步，下面我們就來看如何才能線程同步。

線程同步的基本實作思路還是比較容易了解的。我們可以給共享資源加一把鎖，這把鎖隻有一把鑰匙。哪個線程擷取了這把鑰匙，才有權利通路該共享資源。

生活中，我們也可能會遇到這樣的例子。一些超市的外面提供了一些自動儲物箱。每個儲物箱都有一把鎖，一把鑰匙。人們可以使用那些帶有鑰匙的儲物箱，把東西放到儲物箱裡面，把儲物箱鎖上，然後把鑰匙拿走。這樣，該儲物箱就被鎖住了，其他人不能再通路這個儲物箱。（當然，真實的儲物箱鑰匙是可以被人拿走複制的，是以不要把貴重物品放在超市的儲物箱裡面。于是很多超市都采用了電子密碼鎖。）

線程同步鎖這個模型看起來很直覺。但是，還有一個嚴峻的問題沒有解決，這個同步鎖應該加在哪裡？

當然是加在共享資源上了。反應快的讀者一定會搶先回答。

沒錯，如果可能，我們當然盡量把同步鎖加在共享資源上。一些比較完善的共享資源，比如，檔案系統，資料庫系統等，自身都提供了比較完善的同步鎖機制。我們不用另外給這些資源加鎖，這些資源自己就有鎖。

但是，大部分情況下，我們在代碼中通路的共享資源都是比較簡單的共享對象。這些對象裡面沒有地方讓我們加鎖。

讀者可能會提出建議：為什麼不在每一個對象内部都增加一個新的區域，專門用來加鎖呢？這種設計理論上當然也是可行的。問題在于，線程同步的情況并不是很普遍。如果因為這小機率事件，在所有對象内部都開辟一塊鎖空間，将會帶來極大的空間浪費。得不償失。

于是，現代的程式設計語言的設計思路都是把同步鎖加在代碼段上。确切的說，是把同步鎖加在“通路共享資源的代碼段” 上。這一點一定要記住，同步鎖是加在代碼段上的。

同步鎖加在代碼段上，就很好地解決了上述的空間浪費問題。但是卻增加了模型的複雜度，也增加了我們的了解難度。

現在我們就來仔細分析“同步鎖加在代碼段上 ”的線程同步模型。

首先，我們已經解決了同步鎖加在哪裡的問題。我們已經确定，同步鎖不是加在共享資源上，而是加在通路共享資源的代碼段上。

其次，我們要解決的問題是，我們應該在代碼段上加什麼樣的鎖。這個問題是重點中的重點。這是我們尤其要注意的問題：通路同一份共享資源的不同代碼段，應該加上同一個同步鎖；如果加的是不同的同步鎖，那麼根本就起不到同步的作用，沒有任何意義。

這就是說，同步鎖本身也一定是多個線程之間的共享對象。

Java語言的synchronized關鍵字

為了加深了解，舉幾個代碼段同步的例子。

不同語言的同步鎖模型都是一樣的。隻是表達方式有些不同。這裡我們以目前最流行的Java語言為例。Java語言裡面用synchronized關鍵字給代碼段加鎖。整個文法形式表現為

synchronized(同步鎖) {

// 通路共享資源，需要同步的代碼段

}

這裡尤其要注意的就是，同步鎖本身一定要是共享的對象。

… f1() {

Object lock1 = new Object(); // 産生一個同步鎖

synchronized(lock1){

// 代碼段 A

// 通路共享資源 resource1

// 需要同步

}

上面這段代碼沒有任何意義。因為那個同步鎖是在函數體内部産生的。每個線程調用這段代碼的時候，都會産生一個新的同步鎖。那麼多個線程之間，使用的是不同的同步鎖。根本達不到同步的目的。

同步代碼一定要寫成如下的形式，才有意義。

public static final Object lock1 = new Object();

… f1() {

synchronized(lock1){ // lock1 是公用同步鎖

// 代碼段 A

// 通路共享資源 resource1

// 需要同步

}

你不一定要把同步鎖聲明為static或者public，但是你一定要保證相關的同步代碼之間，一定要使用同一個同步鎖。

講到這裡，你一定會好奇，這個同步鎖到底是個什麼東西。為什麼随便聲明一個Object對象，就可以作為同步鎖？

在Java裡面，同步鎖的概念就是這樣的。任何一個Object Reference都可以作為同步鎖。我們可以把Object Reference了解為對象在記憶體配置設定系統中的記憶體位址。是以，要保證同步代碼段之間使用的是同一個同步鎖，我們就要保證這些同步代碼段的synchronized關鍵字使用的是同一個Object Reference，同一個記憶體位址。這也是為什麼我在前面的代碼中聲明lock1的時候，使用了final關鍵字，這就是為了保證lock1的Object Reference在整個系統運作過程中都保持不變。

一些求知欲強的讀者可能想要繼續深入了解synchronzied(同步鎖)的實際運作機制。Java虛拟機規範中（你可以在google用“JVM Spec”等關鍵字進行搜尋），有對synchronized關鍵字的詳細解釋。synchronized會編譯成 monitor enter, … monitor exit之類的指令對。Monitor就是實際上的同步鎖。每一個Object Reference在概念上都對應一個monitor。

這些實作細節問題，并不是了解同步鎖模型的關鍵。我們繼續看幾個例子，加深對同步鎖模型的了解。

public static final Object lock1 = new Object();

… f1() {

synchronized(lock1){ // lock1 是公用同步鎖

// 代碼段 A

// 通路共享資源 resource1

// 需要同步

}

… f2() {

synchronized(lock1){ // lock1 是公用同步鎖

// 代碼段 B

// 通路共享資源 resource1

// 需要同步

}

上述的代碼中，代碼段A和代碼段B就是同步的。因為它們使用的是同一個同步鎖lock1。

如果有10個線程同時執行代碼段A，同時還有20個線程同時執行代碼段B，那麼這30個線程之間都是要進行同步的。

這30個線程都要競争一個同步鎖lock1。同一時刻，隻有一個線程能夠獲得lock1的所有權，隻有一個線程可以執行代碼段A或者代碼段B。其他競争失敗的線程隻能暫停運作，進入到該同步鎖的就緒（Ready）隊列。

每一個同步鎖下面都挂了幾個線程隊列，包括就緒（Ready）隊列，待召（Waiting）隊列等。比如，lock1對應的就緒隊列就可以叫做lock1 - ready queue。每個隊列裡面都可能有多個暫停運作的線程。

注意，競争同步鎖失敗的線程進入的是該同步鎖的就緒（Ready）隊列，而不是後面要講述的待召隊列（Waiting Queue，也可以翻譯為等待隊列）。就緒隊列裡面的線程總是時刻準備着競争同步鎖，時刻準備着運作。而待召隊列裡面的線程則隻能一直等待，直到等到某個信号的通知之後，才能夠轉移到就緒隊列中，準備運作。

成功擷取同步鎖的線程，執行完同步代碼段之後，會釋放同步鎖。該同步鎖的就緒隊列中的其他線程就繼續下一輪同步鎖的競争。成功者就可以繼續運作，失敗者還是要乖乖地待在就緒隊列中。

是以，線程同步是非常耗費資源的一種操作。我們要盡量控制線程同步的代碼段範圍。同步的代碼段範圍越小越好。我們用一個名詞“同步粒度 ”來表示同步代碼段的範圍。

同步粒度

在Java語言裡面，我們可以直接把synchronized關鍵字直接加在函數的定義上。

比如。

… synchronized … f1() {

// f1 代碼段

}

這段代碼就等價于

… f1() {

synchronized(this){ // 同步鎖就是對象本身

// f1 代碼段

}

同樣的原則适用于靜态（static）函數

比如。

… static synchronized … f1() {

// f1 代碼段

}

這段代碼就等價于

…static … f1() {

synchronized(Class.forName(…)){ // 同步鎖是類定義本身

// f1 代碼段

}

但是，我們要盡量避免這種直接把synchronized加在函數定義上的偷懶做法。因為我們要控制同步粒度。同步的代碼段越小越好。synchronized控制的範圍越小越好。

我們不僅要在縮小同步代碼段的長度上下功夫，我們同時還要注意細分同步鎖。

比如，下面的代碼

public static final Object lock1 = new Object();

… f1() {

synchronized(lock1){ // lock1 是公用同步鎖

// 代碼段 A

// 通路共享資源 resource1

// 需要同步

}

… f2() {

synchronized(lock1){ // lock1 是公用同步鎖

// 代碼段 B

// 通路共享資源 resource1

// 需要同步

}

… f3() {

synchronized(lock1){ // lock1 是公用同步鎖

// 代碼段 C

// 通路共享資源 resource2

// 需要同步

}

… f4() {

synchronized(lock1){ // lock1 是公用同步鎖

// 代碼段 D

// 通路共享資源 resource2

// 需要同步

}

上述的4段同步代碼，使用同一個同步鎖lock1。所有調用4段代碼中任何一段代碼的線程，都需要競争同一個同步鎖lock1。

我們仔細分析一下，發現這是沒有必要的。

因為f1()的代碼段A和f2()的代碼段B通路的共享資源是resource1，f3()的代碼段C和f4()的代碼段D通路的共享資源是resource2，它們沒有必要都競争同一個同步鎖lock1。我們可以增加一個同步鎖lock2。f3()和f4()的代碼可以修改為：

public static final Object lock2 = new Object();

… f3() {

synchronized(lock2){ // lock2 是公用同步鎖

// 代碼段 C

// 通路共享資源 resource2

// 需要同步

}

… f4() {

synchronized(lock2){ // lock2 是公用同步鎖

// 代碼段 D

// 通路共享資源 resource2

// 需要同步

}

這樣，f1()和f2()就會競争lock1，而f3()和f4()就會競争lock2。這樣，分開來分别競争兩個鎖，就可以大大較少同步鎖競争的機率，進而減少系統的開銷。

信号量

同步鎖模型隻是最簡單的同步模型。同一時刻，隻有一個線程能夠運作同步代碼。

有的時候，我們希望處理更加複雜的同步模型，比如生産者/消費者模型、讀寫同步模型等。這種情況下，同步鎖模型就不夠用了。我們需要一個新的模型。這就是我們要講述的信号量模型。

信号量模型的工作方式如下：線程在運作的過程中，可以主動停下來，等待某個信号量的通知；這時候，該線程就進入到該信号量的待召（Waiting）隊列當中；等到通知之後，再繼續運作。

很多語言裡面，同步鎖都由專門的對象表示，對象名通常叫Monitor。

同樣，在很多語言中，信号量通常也有專門的對象名來表示，比如，Mutex，Semphore。

信号量模型要比同步鎖模型複雜許多。一些系統中，信号量甚至可以跨程序進行同步。另外一些信号量甚至還有計數功能，能夠控制同時運作的線程數。

我們沒有必要考慮那麼複雜的模型。所有那些複雜的模型，都是最基本的模型衍生出來的。隻要掌握了最基本的信号量模型——“等待/通知”模型，複雜模型也就迎刃而解了。

我們還是以Java語言為例。Java語言裡面的同步鎖和信号量概念都非常模糊，沒有專門的對象名詞來表示同步鎖和信号量，隻有兩個同步鎖相關的關鍵字——volatile和synchronized。

這種模糊雖然導緻概念不清，但同時也避免了Monitor、Mutex、Semphore等名詞帶來的種種誤解。我們不必執着于名詞之争，可以專注于了解實際的運作原理。

在Java語言裡面，任何一個Object Reference都可以作為同步鎖。同樣的道理，任何一個Object Reference也可以作為信号量。

Object對象的wait()方法就是等待通知，Object對象的notify()方法就是發出通知。

具體調用方法為

（1）等待某個信号量的通知

public static final Object signal = new Object();

… f1() {

synchronized(singal) { // 首先我們要擷取這個信号量。這個信号量同時也是一個同步鎖

// 隻有成功擷取了signal這個信号量兼同步鎖之後，我們才可能進入這段代碼

signal.wait(); // 這裡要放棄信号量。本線程要進入signal信号量的待召（Waiting）隊列

// 可憐。辛辛苦苦争取到手的信号量，就這麼被放棄了

// 等到通知之後，從待召（Waiting）隊列轉到就緒（Ready）隊列裡面

// 轉到了就緒隊列中，離CPU核心近了一步，就有機會繼續執行下面的代碼了。

// 仍然需要把signal同步鎖競争到手，才能夠真正繼續執行下面的代碼。命苦啊。

…

}

需要注意的是，上述代碼中的signal.wait()的意思。signal.wait()很容易導緻誤解。signal.wait()的意思并不是說，signal開始wait，而是說，運作這段代碼的目前線程開始wait這個signal對象，即進入signal對象的待召（Waiting）隊列。

（2）發出某個信号量的通知

… f2() {

synchronized(singal) { // 首先，我們同樣要擷取這個信号量。同時也是一個同步鎖。

// 隻有成功擷取了signal這個信号量兼同步鎖之後，我們才可能進入這段代碼

signal.notify(); // 這裡，我們通知signal的待召隊列中的某個線程。

// 如果某個線程等到了這個通知，那個線程就會轉到就緒隊列中

// 但是本線程仍然繼續擁有signal這個同步鎖，本線程仍然繼續執行

// 嘿嘿，雖然本線程好心通知其他線程，

// 但是，本線程可沒有那麼高風亮節，放棄到手的同步鎖

// 本線程繼續執行下面的代碼

…

}

需要注意的是，signal.notify()的意思。signal.notify()并不是通知signal這個對象本身。而是通知正在等待signal信号量的其他線程。

以上就是Object的wait()和notify()的基本用法。

實際上，wait()還可以定義等待時間，當線程在某信号量的待召隊列中，等到足夠長的時間，就會等無可等，無需再等，自己就從待召隊列轉移到就緒隊列中了。

另外，還有一個notifyAll()方法，表示通知待召隊列裡面的所有線程。

這些細節問題，并不對大局産生影響。

綠色線程

綠色線程（Green Thread）是一個相對于作業系統線程（Native Thread）的概念。

作業系統線程（Native Thread）的意思就是，程式裡面的線程會真正映射到作業系統的線程，線程的運作和排程都是由作業系統控制的

綠色線程（Green Thread）的意思是，程式裡面的線程不會真正映射到作業系統的線程，而是由語言運作平台自身來排程。

目前版本的Python語言的線程就可以映射到作業系統線程。目前版本的Ruby語言的線程就屬于綠色線程，無法映射到作業系統的線程，是以Ruby語言的線程的運作速度比較慢。

難道說，綠色線程要比作業系統線程要慢嗎？當然不是這樣。事實上，情況可能正好相反。Ruby是一個特殊的例子。線程排程器并不是很成熟。

目前，線程的流行實作模型就是綠色線程。比如，stackless Python，就引入了更加輕量的綠色線程概念。線上程并發程式設計方面，無論是運作速度還是并發負載上，都優于Python。

另一個更著名的例子就是ErLang（愛立信公司開發的一種開源語言）。

ErLang的綠色線程概念非常徹底。ErLang的線程不叫Thread，而是叫做Process。這很容易和程序混淆起來。這裡要注意區分一下。

ErLang Process之間根本就不需要同步。因為ErLang語言的所有變量都是final的，不允許變量的值發生任何變化。是以根本就不需要同步。

final變量的另一個好處就是，對象之間不可能出現交叉引用，不可能構成一種環狀的關聯，對象之間的關聯都是單向的，樹狀的。是以，記憶體垃圾回收的算法效率也非常高。這就讓ErLang能夠達到Soft Real Time（軟實時）的效果。這對于一門支援記憶體垃圾回收的語言來說，可不是一件容易的事情。

Java線程同步機制深入闡述

繼續閱讀

關于Gradle配置的小結

Java小案例——随機數猜測随機數猜測

nginx location中斜線的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的簡單使用

neo4j之cypher使用文檔

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

mybatis_入門程式Mybatis入門

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

Effective Java 8:通用程式設計

OOM三種類型

工廠模式-三種類型

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method