天天看點

CAP 理論 —— 最通俗的解釋

CAP 理論是分布式系統的一個基礎理論,它描述了任何一個分布式系統最多隻能滿足以下三個特性中的兩個:

  • 一緻性(Consistency)
  • 可用性(Availability)
  • 分區容忍性(Partition tolerance)

CAP 理論聽起來十分抽象,本文嘗試以生活中的例子并用通俗易懂的語言來解釋 CAP 理論的含義。

第一章:“記憶公司”面世

一天晚上,正準備入睡時,你的妻子對你記住她生日并送她禮物表示感謝。這時,一個商業想法從你的腦海中閃現:人們總是弱于記憶生活中的事情,而我卻擁有超群的記憶力,是以,為何不成立一間公司可以充分運用自己的記憶天賦來賺錢。說幹就幹,接着你在當地一間報社刊登了記憶公司的宣傳廣告:

記憶公司 —— 你的事情永不會忘記

還在為你老是忘記而苦惱?福音來了,隻須一個電話。

當你需要記着某件事情時,請撥打 400 - 888 - 8888,告訴我們你需要記住的事情,下次你需要找回這件事情,請再次撥打電話,我們将會告訴你的所需。

收費: 每次隻需要 10 元。

以下是一次你和顧客的電話對話。

  • 顧客:Hey,麻煩幫我記住我鄰居的生日。
  • 你:好。你鄰居生日是什麼時候?
  • 顧客:1月2日。
  • 你:(在一個本子,翻到這位顧客的一頁,記錄下他鄰居的生日。)好的,已記錄好。下次你找回鄰居的生日,請再次撥打電話。
  • 顧客:謝謝。
  • 你:不客氣,本次收費 10 元。

第二章:業務擴大了

随着時間的推移,記憶公司的業務發展得越來越好,越來越多的顧客打電話進來需要服務。雖然賺到的錢越來越多,但也産生了一個新的問題。

顧客打電話進來時,需要等待的時間越來越多,另外,當你生病時,所有顧客都不能獲得服務,這令人很是煩惱。

于是,你想出了一個新的計劃:

  • 你和你的妻子同時接收顧客的電話
  • 顧客仍然隻需要記着一個公司的服務電話 400 - 888 - 8888
  • 一個路由器會将顧客的電話分發到你和妻子電話上

第三章:服務出錯了

新計劃實施兩天後,你接到了一個名叫 John 的電話,John 是個老顧客了。

  • John:Hey
  • 你:你好,歡迎撥打記憶公司電話,有什麼可以幫到你嗎
  • John:可以告訴我去紐澤西的航班是什麼時候嗎
  • 你:當然。(然後你翻開 John 的頁面,發現并沒有 John 航班的記錄)
  • 你:你好,是不是搞錯了,我們這裡并沒有關于你航班的資訊
  • John:什麼?!昨天我才剛打電話過來說去紐澤西航班的事情

哪裡出錯了?難道 John 撒謊了。你繼續思考導緻出錯的原因。會不會是妻子接到了電話?你走到妻子的桌子,發現妻子将 John 的航班記錄在了本子上,這時你才意識到導緻問題的原因,妻子接聽到 John 的電話,但你的本子沒有 John 的記錄。

如果将上面的實施計劃稱一個分布式的設計,那這個設計存在明顯的問題——一緻性(consistent)的問題。打進來的電話可能其中一人接聽并記錄下來,下次電話查詢時卻可能由另一人接聽,這樣就會出現不一緻的問題,無法為顧客準确提供服務。

第四章:解決一緻性問題

晚上你在床上翻來覆去,最後想到一個解決一緻性問題的辦法,你把新的計劃告訴妻子:

  • 每次接收記錄的電話(顧客要求幫忙記住他們的事情)時,我們同時告知另一個人
  • 這樣,我們兩個人都會在本子更新這位顧客的記錄
  • 下次這位顧客再次打電話進來查詢,這時我們不需要告知對方,因為兩個本子都有這位顧客的記錄了

這個方法隻有一個問題,你告訴妻子,當有顧客需要記錄時,我們不能并行地工作。例如,你接收到記錄的電話并這個資訊告知我,這時我就不能再接聽其他顧客的電話了。但這個問題基本上也是可以接受的,因為大部分顧客的電話都是查詢的。

老公你真聰明,妻子稱贊你,但這個設計還有一個問題。如果某天我們其中一個人有事不能工作了怎麼辦?由于我們要求每次接到記錄電話需要同時更新兩個本子,這就導緻我們不能為顧客提供記錄的服務,這樣就導緻無法滿足 可用性(availability)的要求。例如,當我接到一個記錄的電話時,而你恰好不在,這樣我就無法完成這個顧客的服務。這是由于我無法要求你更新你的本子。

第五章:更好的辦法

這時你才意識到,設計一個分布式的系統是多麼的不容易,難道就沒有同時滿足 一緻性和可用性 的設計嗎?

又經過一晚的思考,你想到一個兩全其美的辦法,新的辦法跟之前的很相似。你把新的辦法告訴妻子:

  • 當接到記錄的電話(顧客要求為他們記錄事情),如果我們兩人當天都上班,那麼我們同時記錄下這位顧客的記錄
  • 但如果另一人當天沒上班,我們可以将記錄通過 E-mail 的方式發送給不上班的人
  • 第二天,沒上班的人上班後第一件事就是接收所有的 E-mail ,并在自己的本子上記錄所有顧客的要求。記錄好後,才開始接收第一個電話。

真是天才,妻子說,這個辦法我找不出任何問題了,而且可以同時滿足 一緻性和可用性 的要求。

第六章:妻子生氣了

第七章:結論

  • 一緻性:一旦顧客更新了記錄,下次再打電話查詢時,總能擷取最新的記錄
  • 可用性:隻要你和妻子有人上班,記憶公司總能為顧客提供服務
  • 分區容忍性:即使你和妻子的溝通無法進行,記憶公司仍然可以提供服務

番外篇:背後的記錄員

參考資料

  1. http://ksat.me/a-plain-english-introduction-to-cap-theorem/
  2. http://robertgreiner.com/2014/08/cap-theorem-revisited/
  3. https://mwhittaker.github.io/blog/an_illustrated_proof_of_the_cap_theorem/

繼續閱讀