zooKeeper學習總結——大資料zooKeeper常見面試題

Zookeeper是什麼架構

分布式的、開源的分布式應用程式協調服務，原本是Hadoop、HBase的一個重要元件。它為分布式應用提供一緻性服務的軟體，包括：配置維護、域名服務、分布式同步、組服務等。

應用場景

Zookeeper的功能很強大，應用場景很多，結合我實際工作中使用Dubbo架構的情況，Zookeeper主要是做注冊中心用。基于Dubbo架構開發的提供者、消費者都向Zookeeper注冊自己的URL，消費者還能拿到并訂閱提供者的注冊URL，以便在後續程式的執行中去調用提供者。而提供者發生了變動，也會通過Zookeeper向訂閱的消費者發送通知。

Zookeeper有哪些特點

zooKeeper學習總結——大資料zooKeeper常見面試題

Paxos算法& Zookeeper使用協定

Paxos算法是分布式選舉算法，Zookeeper使用的 ZAB協定（Zookeeper原子廣播），二者有相同的地方，比如都有一個Leader，用來協調N個Follower的運作；Leader要等待超半數的Follower做出正确回報之後才進行提案；二者都有一個值來代表Leader的周期。

不同的地方在于：

ZAB用來建構高可用的分布式資料主備系統（Zookeeper），Paxos是用來建構分布式一緻性狀态機系統。

Paxos算法、ZAB協定要想講清楚可不是一時半會的事兒，自1990年萊斯利•蘭伯特提出Paxos算法以來，因為晦澀難懂并沒有受到重視。後續幾年，蘭伯特通過好幾篇論文對其進行更進一步地解釋，也直到06年谷歌發表了三篇論文，選擇Paxos作為chubby cell的一緻性算法，Paxos才真正流行起來。

對于普通開發者來說，尤其是學習使用Zookeeper的開發者明确一點就好：分布式Zookeeper選舉Leader伺服器的算法與Paxos有很深的關系。

選舉算法和流程

FastLeaderElection是zookeeper預設提供的選舉算法

選舉流程

目前有5台伺服器，每台伺服器均沒有資料，它們的編号分别是1,2,3,4,5,按編号依次啟動，它們的選擇舉過程如下：

伺服器1啟動，給自己投票，然後發投票資訊，由于其它機器還沒有啟動是以它收不到回報資訊，伺服器1的狀态一直屬于Looking。
伺服器2啟動，給自己投票，同時與之前啟動的伺服器1交換結果，由于伺服器2的編号大是以伺服器2勝出，但此時投票數沒有大于半數，是以兩個伺服器的狀态依然是LOOKING。
伺服器3啟動，給自己投票，同時與之前啟動的伺服器1,2交換資訊，由于伺服器3的編号最大是以伺服器3勝出，此時投票數正好大于半數，是以伺服器3成為leader，伺服器1,2成為follower。
伺服器4啟動，給自己投票，同時與之前啟動的伺服器1,2,3交換資訊，盡管伺服器4的編号大，但之前伺服器3已經勝出，是以伺服器4隻能成為follower。
伺服器5啟動，後面的邏輯同伺服器4成為follower。

Zookeeper對節點的watch監聽通知是永久的嗎？

不是。官方聲明：一個Watch事件是一個一次性的觸發器，當被設定了Watch的資料發生了改變的時候，則伺服器将這個改變發送給設定了Watch的用戶端，以便通知它們。

為什麼不是永久的，舉個例子，如果服務端變動頻繁，而監聽的用戶端很多情況下，每次變動都要通知到所有的用戶端，這太消耗性能了。

一般是用戶端執行getData(“/節點A”,true)，如果節點A發生了變更或删除，用戶端會得到它的watch事件，但是在之後節點A又發生了變更，而用戶端又沒有設定watch事件，就不再給用戶端發送。

在實際應用中，很多情況下，我們的用戶端不需要知道服務端的每一次變動，我隻要最新的資料即可。

部署方式？叢集中的機器角色都有哪些？叢集最少要幾台機器

單機，叢集。Leader、Follower。叢集最低3（2N+1）台，保證奇數，主要是為了選舉算法。

叢集如果有3台機器，挂掉一台叢集還能工作嗎？挂掉兩台呢？

記住一個原則：過半存活即可用。

叢集支援動态添加機器嗎？

其實就是水準擴容了，Zookeeper在這方面不太好。兩種方式：

全部重新開機：關閉所有Zookeeper服務，修改配置之後啟動。不影響之前用戶端的會話。

逐個重新開機：顧名思義。這是比較常用的方式。

zooKeeper學習總結——大資料zooKeeper常見面試題

繼續閱讀

Go語言：zookeeper用戶端可選參數配置

Go語言：samuel的go-zookeeper用戶端監測連接配接是否已建立

Java 用戶端通路 Kafka

大資料高頻面試題之Hive的小檔案合并

linux搭建kafka單機+叢集環境+demo

Kafka：Streams實作單詞統計

Zookeeper 3.6.X支援持久化watcher節點

ZooKeeper ： Curator架構之資料緩存與監聽CuratorCache

kafka環境部署(二)

Kafka學習篇（二）——Kafka環境搭建安裝JDK安裝KafkaKafka指令Kafka配置

zookeeper叢集配置簡單版本

Kafka：Topic概念與API介紹

ZooKeeper ： Curator架構之分布式屏障DistributedDoubleBarrier

ZooKeeper ： Curator架構之分布式鎖InterProcessMutex

Nacos 2.0 更新前後性能對比壓測