天天看點

一文搞懂:“世界備份日“聊聊不同RAID有什麼差別?

如果你接觸電腦的時間足夠久,一定會遇到在某次大掃除中從犄角旮旯裡翻出CD光牒,甚至一張3.5寸軟碟的有趣經曆。這些早已淘汰不用的或方或圓的存儲媒體中,一定還儲存着“人類早期馴服資料”的有趣紀錄。沒錯,資料需要及時備份也是颠撲不破的話題。美國網絡社群Reddit甚至發起倡議活動,建議将愚人節前一天3月31日作為“世界備份日”,提醒大家隻有傻瓜才會忘記備份資料。

一文搞懂:“世界備份日“聊聊不同RAID有什麼差別?

生活在資訊時代的我們,其實每天都在跟海量的資料打交道,至少營運商每天都在發短信提醒我套餐剩餘流量。也許你會說,資料不就在電腦和手機裡擺着麼?但是隻需一杯不小心傾倒的奶茶,你平時不在意的重要檔案資料,就會迅速毀于一旦。而我們逃避這種焦慮的最好方式,不是忽略它,而是及時對資料做備份。

簡單的資料備份,我們平時都會用到。小到一顆U盤,就能夠讓你家庭電子相冊的安全系數加倍。但是随着我們需要存儲的檔案越來越多,又或者是在工作中要随時儲存和讀取重要檔案,相信很多人都選擇了雲盤、NAS、甚至小型伺服器的方式。當然還有更适合中小型企業直連的DAS(直連式存儲)。但其實說到底,他們用到的存儲備份技術大同小異,至少這個詞你應該不陌生——RAID。

一文搞懂:“世界備份日“聊聊不同RAID有什麼差別?

1988年美國加州大學的D. A. Patterson教授首次提出了RAID的概念,起先,RAID(Redundant Array of Inexpensive Disks)的官方說法是“便宜的備援磁盤陣列”。這樣一個怪稱呼誕生,主要是因為在當時,大容量磁盤價格非常昂貴。是以如何利用好多塊容量小、成本易控制的磁盤組合,獲得與大容量硬碟相當的容量、性能以及可靠性,成為了一個非常關鍵的課題。

RAID這種新思路一經推出,就被業界吸納,快發展出一批高性能、高可靠性的新存儲技術,并且時至今日都一直在廣泛應用。如今RAID中“I”的含義已經不再是“Inexpensive便宜的”,而變成“Independent獨立的”;RAID天團也已經從當初D. A. Patterson教授論文中定義的RAID 1到RAID 5“五小強”,擴充出了RAID 0、RAID 6、RAID 7,甚至是RAID 10/01、RAID 50、RAID 53、RAID 100。那這些聽起來好像在不斷“更新”的RAID,彼此之間有什麼關系?不同的RAID對我們到底有哪些幫助?

首先我們厘清一下概念。RAID其實是對一類“多磁盤管理技術”的統稱,我們一般簡稱為“磁盤陣列“。磁盤陣列利用實體存儲空間區隔的方式,為我們備份資料的備援資訊。一旦某個磁盤或通路路徑出現故障,備援資訊就可以快速幫助使用者恢複已故障存儲中儲存的資料。這也就是RAID最常見的用處——日常備份與恢複資料。而不同的RAID等級,彼此之間更多的是方式不同,而非優劣之差。通常RAID 0到RAID 6這七個等級,被預設是标準的RAID等級,因為他們中包含了最基本也是最常用的RAID配置。

RAID 0和RAID 1

首先RAID家族裡有一個著名的混子——RAID 0,甚至RAID 0都不算是一種真正的RAID方式。RAID 0實作起來最簡單,因為它其實是把不同硬碟組合成了一個“大硬碟”,例如一塊2TB硬碟和4TB硬碟組了RAID 0會怎樣?答案是會變成了一塊6TB“大硬碟”,這塊硬碟容量增大了,但是本身不具備任何備份功能。适用于同性能級别硬碟混用且對資料安全性要求不高的應用場景。至于為什麼RAID 0能夠成功混入其中,這還要歸功于它可以提升硬碟陣列的讀寫速度,理論上可以實作直接×N的效果。是以RAID 0也成為一種很常見的RAID方式。

RAID 1也很簡單,資料在RAID 1中是以“1+1”的方式存在,兩塊硬碟此時就互為備份,一塊出了問題,另一塊可以随時頂上,此時我們隻需要更換故障盤就可以了。RAID 1的好處是組陣列的方式簡單,缺點是對容量不友好。因為兩款1TB的硬碟組成RAID 1,實際的可用空間也僅有1TB。看起來十分不科學,但其實RAID 1确實非常保險的備份方式,适合伺服器、資料庫這類對安全性要求很高的應用場景。但相比RAID 0,RAID 1的缺點則是并不能提升磁盤陣列的讀寫性能。

RAID 2

RAID 2相較兩位兄長,就來的進階了一些。它使用了“海明碼”實作資料校驗備援。海明碼的優點是具備糾錯能力,複雜程度不算高。缺點是這種糾錯方式本身并不算高明,因為資料在RAID 2中是按位存儲,4位資料需要4個資料硬碟,16位資料就需要16個資料硬碟。很顯然,這種組合方式非常不靈活,是以在日常使用中我們很少見到RAID 2這種形式的磁盤陣列。

RAID 3和RAID 5

相比RAID 2“一是一,二是二”的磁盤陣列方式,RAID 3和RAID 5顯然就更靈活了,因為無論是何種資料,他們都僅需要最少3塊硬碟就能實作了。其中RAID 3中有一塊專門的硬碟作為校驗盤(RAID 2也用到了校驗盤),用來存放單獨的奇偶校驗資訊。當其中某塊硬碟出問題,可以通過另一塊正常工作的資料盤,加上校驗盤的計算重構,恢複故障盤中所有資料。是以理論上RAID 3非常适合對存儲媒體價格比較敏感的家庭應用場景,日常可以用來存放一些視訊素材、流媒體素材等等,素材量巨大的視訊和其他視覺創意工作者,都建議直接選擇RAID 3做日常資料的備份。

RAID 5和RAID 3的差別在于,RAID 5這種陣列方式,沒有專用的校驗硬碟。RAID 5陣列的校驗資料是随機分布在所有磁盤中的。RAID 5的優缺點都很突出,優點在于它具備非常好的靈活性和擴充性——RAID 5中可以随時增加陣列硬碟的數量,甚至RAID 5還可以模拟RAID 3方式運作,而且理論上RAID 5可以實作(N-1)的讀取速度提升,是以非常适合作為高碼率流媒體播放使用的存儲陣列;缺點則是RAID 5是一種介于RAID 0和RAID 1之間的折中方案,對硬碟的使用率和RAID 3相當,都是N-1。

RAID 4

RAID 4原理上面和RAID 3一脈相承,隻不過校驗方式略有不同。但就是這說大不大說小不小的差別,卻讓RAID 4相比前兩者應用限制更多。RAID 4采用了統計資料塊使用相同XOR校驗的形式。在讀取時可以實作即使校驗,也就是不影響讀取性能。但是寫入時隻能單盤進行,而且要同時寫入校驗資料,是以校驗盤的寫入速度,就很容易成為整個陣列的性能瓶頸(這也是RAID 3存在的問題,但RAID 3的組合方式更加靈活,是以應用場景更廣泛)。目前主流存儲産品中很少見到RAID 4這種備份方式。

RAID 6

看到這裡的小夥伴可能有個大大的疑惑,前面提到的RAID等級,貌似隻能保護單塊硬碟出現故障的情況。因為一旦兩塊資料盤同時發生故障,整個陣列依然會資料崩潰。那麼這時候就輪到RAID 6出場了。RAID 6首次引入了雙重校驗的概念,也就是陣列中畸變發生兩個資料盤同時失效的情況,整個陣列依然可以保障資料安全。同時RAID 6也是在RAID 5思路基礎上出現的一種“加強級”方案,可以看作RAID 5的等級擴充。當然代價是,RAID 6至少需要4塊硬碟組合(N-2構成備份),往往适合對資料安全等級要求極高的應用場景。

RAID 10

除了以上的RAID“七兄弟”,還有一種非常常見的RAID方式——RAID 10,也有人把它稱作RAID 01。因為RAID 10其實是RAID 0和RAID 1的組合。先将硬碟兩兩建構RAID 1備份,再通過RAID 0的方式建構擴充。是以使用效率和安全性方面。RAID 10結合了RAID 0和RAID 1的優缺點,安全的同時硬碟使用率僅有一半,但由于組合方式比較簡單,是以适合安全和效率需折中的應用場合,比如金融業、電影創作等領域。同理,之前提到的RAID 50、RAID 53、RAID 100這些大數字RAID,同樣是以上七種常用RAID方式的有機組合。但除了RAID 10外,其它幾種RAID等級實作起來成本更高,是以也就并不常見了。

下面也為大家總結一個無腦選擇法:

追求大容量,不考慮資料安全=RAID 0;

不追求大容量,考慮資料安全=RAID 1;

即要大容量,又要資料安全,大檔案存儲為主=RAID 3;

即要大容量,又要資料安全,小檔案存儲為主=RAID 5;

資料安全性要求更高=RAID 6。

了解了以上的RAID等級,你也就明白了為什麼常見的NAS分成了雙盤位、四盤位和六盤位三種。雙盤位隻适合散裝以及RAID 0、RAID 1,四盤位則在RAID 0、RAID 1之外,增加了對RAID 3和RAID 5的支援,擴充性和RAID靈活性,相比雙盤位就提升了一個等級。至于六盤位,那顯然是為更高安全性的RAID 6和更大容量而設計的。

衆所周知,高性能和高可靠性的西部資料WD Red系列,一直是NAS使用者的極佳選擇。此前我們也評測了WD Red SN700 NVMe SSD這款高性能SSD,但對大量I/O密集型工作負載的使用者,大容量、高性能、高安全性的WD Red SN700,無疑是建構NAS高速緩存的極佳選擇。

一文搞懂:“世界備份日“聊聊不同RAID有什麼差別?

WD Red SN700 NVMe SSD

詳見這篇文章:

最近,針對單盤大容量存儲需求,西部資料又推出了WD Red Pro 20TB HDD,借助9個ePMR(能量輔助垂直磁記錄)盤片,在3.5英寸體積内塞入了誇張的20TB容量。并且西部資料 WD Red Pro 20TB采用了西部資料的 OptiNAND 技術,通過 iNAND UFS 嵌入式閃存驅動器 (EFD) 提供更高的性能、可靠性和容量。參數方面,西部資料 WD Red Pro 20TB采用 SATA 接口,标配512MB緩存,轉速為7200RPM,擁有快至268 MB/s的優秀讀取性能。對于追求極限單盤容量的小夥伴,WD Red Pro 20TB顯然是很好的選擇。

一文搞懂:“世界備份日“聊聊不同RAID有什麼差別?

WD Red Pro 20TB HDD

繼續閱讀