一、什麼是高可用叢集
高可用叢集(High Availability Cluster,簡稱HA Cluster),是指以減少服務中斷時間為目的的伺服器叢集技術。它通過保護使用者的業務程式對外不間斷地提供服務,把因為軟體,硬體,人為造成的故障對業務的影響降低到最小程度。總而言之就是保證公司業務7*24小時不當機
二、高可用叢集的衡量标準
通常用平均無故障時間(MTTF:mean time to failure)來衡量系統的可靠性,用平均故障維修時間(MTTR:Mean Time Between Failures)來度量系統的可維護性。于是可用性被定義為: HA=MTTF/(MTTF+MTTR)*100%。

三、高可用叢集實作原理
高可用叢集主要是實作自動偵測(Auto-Detect)故障、自動切換/故障轉移(FailOver)和 自動恢複(FailBack)。
1:自動偵測、故障檢測:通過叢集各節點間心跳資訊判斷節點是否出現故障;
2:當有節點(一個或多個)和另外節點互相接收不到對方心跳資訊時,如何決定哪一部分接點是正常運作的,而哪一部分是出現故障需要隔離的呢?
這時候通過法定票數(quorum)決定,即當有節點故障時,節點間投票決定哪個節點是有問題,得票數大于半數為合法,每個節點可以設定其票數,當一個節點能和另一個節點保持心跳資訊,該節點就擷取了另一個節點的票數,該節點獲得就是正常節點,反之為故障節點。
四、高可用叢集的分類
雙機熱備(Active/Passive)
多節點熱備(N+1)
多節點共享存儲(N-TO-N)
共享存儲熱備 (Split Site)
五、高可用叢集軟體
在高可用叢集朝多樣化、易操作維護等方向迅速發展的今天,市場上的叢集軟體産品也品種繁多,但對于任何一款高可用叢集産品,故障監視都是最核心的功能。監視資源種類的多少和監視層次的深淺,都成為評價一款叢集軟體高可用性的重要名額。目前市面上成熟的高可用叢集軟體已有不少,比如國外就有RedHat 公司的RHCS、Novell公司的Novell Cluster Service、Steeleye公司的Lifekeeper for Linux、Keepalived等,在國内其實也有,比如中興新支點的Newstart HA 就已經做得不錯。
以國内的Newstart HA 為例簡單介紹一下。Newstart HA由中興子公司“新支點”研發,是國内具有代表性的一款成熟的高可用叢集軟體。NewStart HA無需改變任何服務和應用,即可保證系統故障和部件故障時應用不中斷;可以自動監控伺服器、網卡、浮動 IP 、存儲和業務,生産中心失效會自動切換到災備中心;可實作資料實時同步,切換時間為秒級,是以可以提供電信級,高達 99.999% 的高可用性。