天天看點

網站架構優化性能

最開始的網站架構

        最初業務量不大,通路量小,此時的架構,應用程式、資料庫、檔案都部署在一台伺服器上,有些甚至僅僅是租用主機空間

網站架構優化性能

1. 應用、資料、檔案分離

        将應用程式、資料庫、檔案各自部署在獨立的伺服器上,并且根據伺服器的用途配置不同的硬體,達到最佳的性能效果。

網站架構優化性能

2. 利用緩存改善網站性能

        大部分網站通路都遵循28原則,即80%的通路請求,最終落在20%的資料上,是以我們可以對熱點資料進行緩存,減少熱點資料的通路路徑,提高使用者體驗。緩存實作常見的方式是本地緩存、分布式緩存。當然還有CDN、反向代理。

2.1 本地緩存        本地緩存,顧名思義是将資料緩存在應用伺服器本地,可以存在記憶體中,也可以存在檔案,元件。本地緩存的特點是速度快,但因為本地空間有限是以緩存資料量也有限。OSCache就是常用的本地緩存。

網站架構優化性能

2.2 分布式緩存        分布式緩存的特點是,可以緩存海量的資料,并且擴充非常容易,在門戶類網站中常常被使用,速度按理沒有本地緩存快,常用的分布式緩存是Memcached、Redis。

網站架構優化性能

2.3 反向代理        部署在網站的機房,當使用者請求達到時首先通路反向代理伺服器,反向代理伺服器将緩存的資料傳回給使用者,如果沒有緩存資料才會繼續通路應用伺服器擷取,這樣做減少了擷取資料的成本。反向代理有Squid,Nginx。

網站架構優化性能

2.4 CDN        假設我們的伺服器都部署在杭州的機房,對于浙江的使用者來說通路是較快的,而對于北京的使用者通路是較慢的,這是由于浙江和北京分别屬于電信和聯通的不同發達地區,北京使用者通路需要通過互聯路由器經過較長的路徑才能通路到杭州的伺服器,傳回路徑也一樣,是以資料傳輸時間比較長。對于這種情況,常常使用CDN解決,CDN将資料内容緩存到營運商的機房,使用者通路時先從最近的營運商擷取資料,這樣大大減少了網絡通路的路徑。比較專業的CDN營運商有藍汛、網宿。

網站架構優化性能

3. 使用叢集+負載均衡改善應用伺服器性能

        應用伺服器作為網站的入口,會承擔大量的請求,我們往往通過應用伺服器叢集來分擔請求數。        應用伺服器前面部署負載均衡伺服器排程使用者請求,根據分發政策将請求分發到多個應用伺服器節點。

網站架構優化性能

        常用的負載均衡技術硬體的有F5,價格比較貴一般都在15W以上。        軟體的有LVS、Nginx、HAProxy。LVS是四層(傳輸層)負載均衡,根據目标位址和端口選擇内部伺服器,Nginx和HAProxy是七層(應用層)負載均衡,可以根據封包内容選擇内部伺服器,是以LVS分發路徑優于Nginx 和HAProxy,性能要高些,而Nginx和HAProxy則更具配置性,如可以用來做動靜分離(根據請求封包特征,選擇靜态資源伺服器還是應用伺服器)。

網站架構優化性能

4. 資料庫優化

4.1 讀寫分離和分庫分表        随着使用者量的增加,資料庫成為最大的瓶頸,改善資料庫性能常用的手段是進行讀寫分離以及分庫分表,讀寫分離顧名思義就是将資料庫分為讀庫和寫庫,通過主備功能實作資料同步。分庫分表則分為水準切分和垂直切分,水準切分則是對一個資料庫特大的表進行拆分,例如使用者表。垂直切分則是根據業務的不同來切分,如使用者業務、商品業務相關的表放在不同的資料庫中。

網站架構優化性能

4.2 使用NoSql資料庫和搜尋引擎        對于海量資料的查詢和分析,我們使用nosql資料庫加上搜尋引擎可以達到更好的性能。并不是所有的資料都要放在關系型資料中。常用的NOSQL有mongodb、hbase、redis,搜尋引擎有lucene、solr、elasticsearch。

網站架構優化性能

5. 将應用伺服器進行業務拆分

        随着業務的擴充,應用程式變得非常臃腫,這時我們需要将應用程式進行業務拆分,如百度分為新聞、網頁、圖檔等業務。每個業務應用負責相對獨立的業務運作。業務之間通過消息進行通信或者共享資料庫來實作。

網站架構優化性能

6.使用分布式系統

6.1 分布式檔案系統        使用者一天天增加,業務量越來越大,産生的檔案越來越多,單台的檔案伺服器已經不能滿足需求,這時就需要分布式檔案系統的支撐。常用的分布式檔案系統有GFS、HDFS、TFS。

網站架構優化性能

GFS(Google File System)可以給大量的使用者提供總體性能較高的服務

• 适合部署在廉價的普通硬體上

• 提供容錯功能

HDFS(Hadoop Distributed File System)能提供高吞吐量的資料通路,非常适合大規模資料集上的應用

• 運作在通用硬體(commodityhardware)

• 高度容錯

• 适合部署在廉價的機器上

TFS(Taobao Flies System)主要針對海量的非結構化資料,提供高可靠和高并發的存儲通路

• 高可擴充、高可用、高性能

• 面向網際網路服務

• 适合海量小檔案存儲

6.2 分布式服務        各個業務應用都會使用到一些基本的業務服務,例如使用者服務、訂單服務、支付服務、安全服務,這些服務是支撐各業務應用的基本要素。我們将這些服務抽取出來利用分部式服務架構搭建分布式服務。阿裡的Dubbo是一個不錯的選擇。

網站架構優化性能

小結

        完整的系統架構圖如下:

繼續閱讀