天天看點

帶你讀《存儲漫談Ceph原理與實踐》第一章分布式存儲概述1.1存儲系統的架構演進(一)

雲計算與大資料技術的發展,推動存儲系統架構的持續演進,存儲系統從最原始的基   于主機的架構逐漸向網絡化、虛拟化方向發展,存儲系統更加關注性能、效率、靈活性、   安全性的提升,而這些特性都需要好的存儲架構來滿足。

粗略分類,存儲架構的演進可以劃分為以下兩個階段。

第一階段:從離散化到集中化的演進(從DAS到SAN/NAS)。

網際網路發展初期,存儲需求相對簡單,資料規模較小,存儲系統架構以存儲媒體直連伺服器(Direct-Attached   Storage,DAS)為主,存儲媒體直接挂載到伺服器的總線上來提供資料通路服務,資料儲存設備與伺服器是一種“同生共死”的狀态。

這種方式可以簡潔地解決資料的存儲需求,但也存在着較為明顯的弊端。

◆  伺服器之間的存儲系統形成“孤島”,限制資料的共享通路;

◆  随着 CPU 處理能力逐漸增強,SCSI連接配接通道會成為 I/O 的瓶頸,制約性能發揮;

◆  随着資料量增長,存儲的安全性(備份 /恢複需求)、擴充性問題日益凸顯。

基于以上症結,存儲區域網絡(StorageAreaNetwork,SAN)架構以及網絡附屬存儲(NetworkAttached Storage,NAS)架構應運而生。

圖 1-1展示了 DAS、SAN、NAS使用方式的差異。

帶你讀《存儲漫談Ceph原理與實踐》第一章分布式存儲概述1.1存儲系統的架構演進(一)

圖 1-1OAS、SAN、NAS使用方式示意

SAN是一種專門為存儲建立的獨立于 TCP/IP 資料網絡之外的專用網絡,連接配接伺服器和磁盤陣列裝置,提供高速的資料傳輸,儲存設備在伺服器側以塊儲存設備形式展現。目前常見的SAN有IP-SAN和FC-SAN(FC是指FibreChannel,光纖通道),其中IP-SAN

通過TCP協定轉發SCS(I  SmallComputerSystemInterface,小型計算機系統接口)協定,

FC-SAN通過光纖通道協定轉發SCSI協定(采用光纖接口,可以提供更高的帶寬)。SAN的結構允許任何伺服器連接配接到任何存儲陣列,不管資料放置在哪裡,伺服器都可以直接存取所需的資料,這樣的方式也便于系統的統一管理以及集中控制。成本與複雜性是SAN存儲架構較為明顯的缺陷。

NAS是連接配接在網絡上具備資料存儲功能的裝置,是以也稱為“網絡存儲器”,可提供跨平台檔案共享功能。NAS 以資料為中心,将儲存設備與伺服器徹底分離,集中管理資料,儲存設備在伺服器側以檔案系統形式展現。NAS本身能夠支援多種協定(如NFS、CIFS、FTP、HTTP等),而且能夠支援各種作業系統。NAS資料存儲适用于需要通過網絡将檔案資料傳送到多台客戶機上進行通路的使用者,可以提供高效的檔案共享服務。NAS的缺點也較為明顯,擴充性受到裝置大小的限制,且隻能提供檔案級通路,無法滿足block級應用的使用需求。

第二階段:從集中化到虛拟化的演進(從 SAN/NAS到分布式存儲系統)。

SAN/NAS    解決方案的出現,實作了存儲系統集中化建設及統一化管理的訴求,為規模化的資料中心基礎設施建設提供了便捷途徑。資料中心建設過程中不可避免地會出現采購規範多元化、裝置型号多樣化的情況,儲存設備的相容性問題、異構硬體的統一性問題會給企業的資料運維帶來棘手的挑戰。存儲虛拟化技術應運而生,其核心思想是将資源的邏輯映像與實體存儲分開,通過存儲系統或存儲服務内部功能進行抽象、隐藏和隔離,屏蔽不同實體裝置的異構屬性,實作資料服務與實體硬體的獨立管理,如圖1-2所示。

帶你讀《存儲漫談Ceph原理與實踐》第一章分布式存儲概述1.1存儲系統的架構演進(一)

圖 1-2 存儲虛拟化示意

分布式存儲系統是存儲虛拟化技術的常見展現形式,分布式存儲系統将資料分散存儲在多台獨立的裝置上,并對外提供統一的存儲服務。分布式存儲系統具有高度的可伸縮性以及可擴充性,具有強大的資料通路性能,且對标準化硬體支援更好,允許大規模存儲系統可以通過相對低廉的成本進行建設與運維。

抛開存儲系統架構演進的萌芽階段的方案(DAS存儲方案),可以将存儲系統架構分為傳統的集中式存儲系統以及新興的分布式存儲系統兩大類,二者有較大的差異,表現在:

◆  傳統的存儲系統采用集中的存儲伺服器存放所有資料,存儲伺服器成為系統性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規模存儲應用的需要;

◆  分布式存儲系統采用可擴充的系統結構,利用多台存儲伺服器分擔存儲負載,利用索引定位資料存儲位置資訊,不但提高了存儲系統的可靠性、可用性以及資料存取效率,   還更易于擴充。

1.1.1   集中式存儲系統

傳統的存儲也稱為集中式存儲,從概念上可以看出其架構具有集中性,也就是整個存儲是集中在一個系統中的。但集中式存儲并不一定隻是一台單獨的裝置,也可以是集中在一套系統當中的多個裝置,如圖1-3中的 SAN 存儲方案就使用了幾個機櫃來存放資料。

在集中式存儲系統中包含很多元件,如機頭(控制器)、磁盤陣列(JBOD)、交換機以及管理裝置等,如圖 1-4所示。

集中式存儲系統中最為核心的部件是機頭,機頭中的控制器實作了集中式存儲系統中絕大多數的進階功能,如對磁盤的管理、将磁盤抽象化為存儲資源池、劃分邏輯單元号

(LogicalUnitNumber,LUN)給用戶端使用等,通常機頭中包含兩個控制器,互為主備,避免硬體故障導緻整個存儲系統的不可用。機頭中包含前端端口以及後端端口,前端端口   對外連接配接,提供存儲服務,後端端口為機頭連接配接更多的儲存設備,形成更大的存儲資源池,擴充存儲系統的容量。

機頭作為集中式存儲系統的統一入口,其處理能力及擴充能力決定了系統整體的定位,通常集中式存儲系統隻能提供有限的存儲系統縱向擴充(scaleup)1能力,很難滿足存儲系統橫向擴充(scaleout)2的需求。通常情況下,可以通過scaleup 方式來擴充單台伺服器的性能,滿足業務的需求;一旦遇到伺服器性能的瓶頸上限後,就需要轉而求助于scaleout方式來進一步滿足要求。

1scaleup(縱向擴充)指企業大型伺服器通過增加處理器等運算資源進行更新以獲得對應用性能的要求。

2scaleout(橫向擴充)指企業可以根據需求增加不同的伺服器應用,依靠多台伺服器協同運算,并通過負載平衡以及容錯等功能來提高運算能力及可靠度。

帶你讀《存儲漫談Ceph原理與實踐》第一章分布式存儲概述1.1存儲系統的架構演進(一)

圖1-3    集中式存儲系統示例          

帶你讀《存儲漫談Ceph原理與實踐》第一章分布式存儲概述1.1存儲系統的架構演進(一)

 圖1-4集中式存儲系統元件示意

繼續閱讀