天天看點

(總結)Nginx/LVS/HAProxy負載均衡軟體的優缺點詳解

作者: 部落格教主

PS:Nginx/LVS/HAProxy是目前使用最廣泛的三種負載均衡軟體,本人都在多個項目中實施過,參考了一些資料,結合自己的一些使用經驗,總結一下。

一般對負載均衡的使用是随着網站規模的提升根據不同的階段來使用不同的技術。具體的應用需求還得具體分析,如果是中小型的Web應用,比如日PV小于1000萬,用Nginx就完全可以了;如果機器不少,可以用DNS輪詢,LVS所耗費的機器還是比較多的;大型網站或重要的服務,且伺服器比較多時,可以考慮用LVS。

一種是通過硬體來進行進行,常見的硬體有比較昂貴的F5和Array等商用的負載均衡器,它的優點就是有專業的維護團隊來對這些服務進行維護、缺點就是花銷太大,是以對于規模較小的網絡服務來說暫時還沒有需要使用;另外一種就是類似于Nginx/LVS/HAProxy的基于Linux的開源免費的負載均衡軟體,這些都是通過軟體級别來實作,是以費用非常低廉。

目前關于網站架構一般比較合理流行的架構方案:Web前端采用Nginx/HAProxy+Keepalived作負載均衡器;後端采用MySQL資料庫一主多從和讀寫分離,采用LVS+Keepalived的架構。當然要根據項目具體需求制定方案。

下面說說各自的特點和适用場合。

一、Nginx

Nginx的優點是:

1、工作在網絡的7層之上,可以針對http應用做一些分流的政策,比如針對域名、目錄結構,它的正則規則比HAProxy更為強大和靈活,這也是它目前廣泛流行的主要原因之一,Nginx單憑這點可利用的場合就遠多于LVS了。

2、Nginx對網絡穩定性的依賴非常小,理論上能ping通就就能進行負載功能,這個也是它的優勢之一;相反LVS對網絡穩定性依賴比較大,這點本人深有體會;

3、Nginx安裝和配置比較簡單,測試起來比較友善,它基本能把錯誤用日志列印出來。LVS的配置、測試就要花比較長的時間了,LVS對網絡依賴比較大。

3、可以承擔高負載壓力且穩定,在硬體不差的情況下一般能支撐幾萬次的并發量,負載度比LVS相對小些。

4、Nginx可以通過端口檢測到伺服器内部的故障,比如根據伺服器處理網頁傳回的狀态碼、逾時等等,并且會把傳回錯誤的請求重新送出到另一個節點,不過其中缺點就是不支援url來檢測。比如使用者正在上傳一個檔案,而處理該上傳的節點剛好在上傳過程中出現故障,Nginx會把上傳切到另一台伺服器重新處理,而LVS就直接斷掉了,如果是上傳一個很大的檔案或者很重要的檔案的話,使用者可能會是以而不滿。

5、Nginx不僅僅是一款優秀的負載均衡器/反向代理軟體,它同時也是功能強大的Web應用伺服器。LNMP也是近幾年非常流行的web架構,在高流量的環境中穩定性也很好。

6、Nginx現在作為Web反向加速緩存越來越成熟了,速度比傳統的Squid伺服器更快,可以考慮用其作為反向代理加速器。

7、Nginx可作為中層反向代理使用,這一層面Nginx基本上無對手,唯一可以對比Nginx的就隻有lighttpd了,不過lighttpd目前還沒有做到Nginx完全的功能,配置也不那麼清晰易讀,社群資料也遠遠沒Nginx活躍。

8、Nginx也可作為靜态網頁和圖檔伺服器,這方面的性能也無對手。還有Nginx社群非常活躍,第三方子產品也很多。

淘寶的前端使用的Tengine就是基于nginx做的二次開發定制版。

Nginx正常的HTTP請求和響應流程圖:

(總結)Nginx/LVS/HAProxy負載均衡軟體的優缺點詳解

Nginx的缺點是:

1、Nginx僅能支援http、https和Email協定,這樣就在适用範圍上面小些,這個是它的缺點。

2、對後端伺服器的健康檢查,隻支援通過端口來檢測,不支援通過url來檢測。不支援Session的直接保持,但能通過ip_hash來解決。

二、LVS

LVS:使用Linux核心叢集實作一個高性能、高可用的負載均衡伺服器,它具有很好的可伸縮性(Scalability)、可靠性(Reliability)和可管理性(Manageability)。

LVS的優點是:

1、抗負載能力強、是工作在網絡4層之上僅作分發之用,沒有流量的産生,這個特點也決定了它在負載均衡軟體裡的性能最強的,對記憶體和cpu資源消耗比較低。

2、配置性比較低,這是一個缺點也是一個優點,因為沒有可太多配置的東西,是以并不需要太多接觸,大大減少了人為出錯的幾率。

3、工作穩定,因為其本身抗負載能力很強,自身有完整的雙機熱備方案,如LVS+Keepalived,不過我們在項目實施中用得最多的還是LVS/DR+Keepalived。

4、無流量,LVS隻分發請求,而流量并不從它本身出去,這點保證了均衡器IO的性能不會收到大流量的影響。

5、應用範圍比較廣,因為LVS工作在4層,是以它幾乎可以對所有應用做負載均衡,包括http、資料庫、線上聊天室等等。

LVS DR(Direct Routing)模式的網絡流程圖:

(總結)Nginx/LVS/HAProxy負載均衡軟體的優缺點詳解

LVS的缺點是:

1、軟體本身不支援正規表達式處理,不能做動靜分離;而現在許多網站在這方面都有較強的需求,這個是Nginx/HAProxy+Keepalived的優勢所在。

2、如果是網站應用比較龐大的話,LVS/DR+Keepalived實施起來就比較複雜了,特别後面有Windows Server的機器的話,如果實施及配置還有維護過程就比較複雜了,相對而言,Nginx/HAProxy+Keepalived就簡單多了。

三、HAProxy

HAProxy的特點是:

1、HAProxy也是支援虛拟主機的。

2、HAProxy的優點能夠補充Nginx的一些缺點,比如支援Session的保持,Cookie的引導;同時支援通過擷取指定的url來檢測後端伺服器的狀态。

3、HAProxy跟LVS類似,本身就隻是一款負載均衡軟體;單純從效率上來講HAProxy會比Nginx有更出色的負載均衡速度,在并發處理上也是優于Nginx的。

4、HAProxy支援TCP協定的負載均衡轉發,可以對MySQL讀進行負載均衡,對後端的MySQL節點進行檢測和負載均衡,大家可以用LVS+Keepalived對MySQL主從做負載均衡。

5、HAProxy負載均衡政策非常多,HAProxy的負載均衡算法現在具體有如下8種:

① roundrobin,表示簡單的輪詢,這個不多說,這個是負載均衡基本都具備的;

② static-rr,表示根據權重,建議關注;

③ leastconn,表示最少連接配接者先處理,建議關注;

④ source,表示根據請求源IP,這個跟Nginx的IP_hash機制類似,我們用其作為解決session問題的一種方法,建議關注;

⑤ ri,表示根據請求的URI;

⑥ rl_param,表示根據請求的URl參數’balance url_param’ requires an URL parameter name;

⑦ hdr(name),表示根據HTTP請求頭來鎖定每一次HTTP請求;

⑧ rdp-cookie(name),表示根據據cookie(name)來鎖定并哈希每一次TCP請求。

四、總結

Nginx和LVS對比的總結:

1、Nginx工作在網絡的7層,是以它可以針對http應用本身來做分流政策,比如針對域名、目錄結構等,相比之下LVS并不具備這樣的功能,是以Nginx單憑這點可利用的場合就遠多于LVS了;但Nginx有用的這些功能使其可調整度要高于LVS,是以經常要去觸碰觸碰,觸碰多了,人為出問題的幾率也就會大。

2、Nginx對網絡穩定性的依賴較小,理論上隻要ping得通,網頁通路正常,Nginx就能連得通,這是Nginx的一大優勢!Nginx同時還能區分内外網,如果是同時擁有内外網的節點,就相當于單機擁有了備份線路;LVS就比較依賴于網絡環境,目前來看伺服器在同一網段内并且LVS使用direct方式分流,效果較能得到保證。另外注意,LVS需要向托管商至少申請多一個ip來做Visual IP,貌似是不能用本身的IP來做VIP的。要做好LVS管理者,确實得跟進學習很多有關網絡通信方面的知識,就不再是一個HTTP那麼簡單了。

3、Nginx安裝和配置比較簡單,測試起來也很友善,因為它基本能把錯誤用日志列印出來。LVS的安裝和配置、測試就要花比較長的時間了;LVS對網絡依賴比較大,很多時候不能配置成功都是因為網絡問題而不是配置問題,出了問題要解決也相應的會麻煩得多。

4、Nginx也同樣能承受很高負載且穩定,但負載度和穩定度差LVS還有幾個等級:Nginx處理所有流量是以受限于機器IO和配置;本身的bug也還是難以避免的。

5、Nginx可以檢測到伺服器内部的故障,比如根據伺服器處理網頁傳回的狀态碼、逾時等等,并且會把傳回錯誤的請求重新送出到另一個節點。目前LVS中 ldirectd也能支援針對伺服器内部的情況來監控,但LVS的原理使其不能重發請求。比如使用者正在上傳一個檔案,而處理該上傳的節點剛好在上傳過程中出現故障,Nginx會把上傳切到另一台伺服器重新處理,而LVS就直接斷掉了,如果是上傳一個很大的檔案或者很重要的檔案的話,使用者可能會是以而惱火。

6、Nginx對請求的異步處理可以幫助節點伺服器減輕負載,假如使用apache直接對外服務,那麼出現很多的窄帶連結時apache伺服器将會占用大 量記憶體而不能釋放,使用多一個Nginx做apache代理的話,這些窄帶連結會被Nginx擋住,apache上就不會堆積過多的請求,這樣就減少了相當多的資源占用。這點使用squid也有相同的作用,即使squid本身配置為不緩存,對apache還是有很大幫助的。

7、Nginx能支援http、https和email(email的功能比較少用),LVS所支援的應用在這點上會比Nginx更多。在使用上,一般最前端所采取的政策應是LVS,也就是DNS的指向應為LVS均衡器,LVS的優點令它非常适合做這個任務。重要的ip位址,最好交由LVS托管,比如資料庫的 ip、webservice伺服器的ip等等,這些ip位址随着時間推移,使用面會越來越大,如果更換ip則故障會接踵而至。是以将這些重要ip交給 LVS托管是最為穩妥的,這樣做的唯一缺點是需要的VIP數量會比較多。Nginx可作為LVS節點機器使用,一是可以利用Nginx的功能,二是可以利用Nginx的性能。當然這一層面也可以直接使用squid,squid的功能方面就比Nginx弱不少了,性能上也有所遜色于Nginx。Nginx也可作為中層代理使用,這一層面Nginx基本上無對手,唯一可以撼動Nginx的就隻有lighttpd了,不過lighttpd目前還沒有能做到 Nginx完全的功能,配置也不那麼清晰易讀。另外,中層代理的IP也是重要的,是以中層代理也擁有一個VIP和LVS是最完美的方案了。具體的應用還得具體分析,如果是比較小的網站(日PV小于1000萬),用Nginx就完全可以了,如果機器也不少,可以用DNS輪詢,LVS所耗費的機器還是比較多的;大型網站或者重要的服務,機器不發愁的時候,要多多考慮利用LVS。

現在對網絡負載均衡的使用是随着網站規模的提升根據不同的階段來使用不同的技術:

第一階段:利用Nginx或HAProxy進行單點的負載均衡,這一階段伺服器規模剛脫離開單伺服器、單資料庫的模式,需要一定的負載均衡,但是仍然規模較小沒有專業的維護團隊來進行維護,也沒有需要進行大規模的網站部署。這樣利用Nginx或HAproxy就是第一選擇,此時這些東西上手快, 配置容易,在七層之上利用HTTP協定就可以。這時是第一選擇。

第二階段:随着網絡服務進一步擴大,這時單點的Nginx已經不能滿足,這時使用LVS或者商用Array就是首要選擇,Nginx此時就作為LVS或者Array的節點來使用,具體LVS或Array的是選擇是根據公司規模和預算來選擇,Array的應用傳遞功能非常強大,本人在某項目中使用過,成本效益也遠高于F5,商用首選!但是一般來說這階段相關人才跟不上業務的提升,是以購買商業負載均衡已經成為了必經之路。

第三階段:這時網絡服務已經成為主流産品,此時随着公司知名度也進一步擴充,相關人才的能力以及數量也随之提升,這時無論從開發适合自身産品的定制,以及降低成本來講開源的LVS,已經成為首選,這時LVS會成為主流。

最終形成比較理想的基本架構為:Array/LVS — Nginx/Haproxy — Squid/Varnish — AppServer。

永久連結 : http://www.ha97.com/5646.html