天天看點

新一代伺服器預覽:M.2 SSD系統盤RAID1方案

本文參考了Dell TechCenter公布的一份白皮書——《Direct from Development -PowerEdge Boot Optimized Storage Solution (BOSS)》,結尾處會列出下載下傳位址。

為什麼是M.2 SATA而不是NVMe SSD?

簡單來說,Boot Optimized Storage Solution是一塊安裝在PCIe槽位的擴充卡,上面可以有1-2個M.2(2280)SATA SSD,用于系統盤并支援RAID 1。可以節約額外的2.5英寸驅動器槽位。

許多朋友應該都知道M.2 SSD外形可以做成NVMe或者SATA兩種接口協定,通常前者性能較高。那麼崇尚參數的人可能要開噴了?别着急:)我們先來看看這樣做的目的是什麼,或者說如果你是産品經理會怎麼選?

NVMe SSD有許多優點,但是隻用于系統盤呢?

1、  這裡的M.2裝置是讀密集型(Boot Class)120GB/240GB,與2.5英寸SATA SSD相同的成本和性能。目的很明确——就是用于系統盤,而且SSD在此處替代HDD機械硬碟已經漸成趨勢,無論從功耗還是故障率來看。

上面照片拍攝于PowerEdge 12G釋出會,如今在伺服器機箱後端提供2個2.5英寸盤位已經比較多見。由于SSD沒有機械部件故障率降低,RAID1保證可靠性卻不急于換盤;還有些使用者不做RAID,系統盤熱插拔的需求不再明顯。當然節約空間的M.2也适合固定在機箱裡。

2、  固定功能硬RAID 1(鏡像)或者Pass-Through直通。雙口SATA硬體RAID控制晶片,合并2個SSD和控制晶片到單一PCIe适配卡上。由于隻是RAID1,應該不需要NVRAM那些複雜的設計,但是OS相容性比較重要。

在不做RAID的情況下,單系統盤NVMe引導的相容性也沒有傳統SATA好,至少要使用UEFI。

3、Boot OptimizedStorage Solution的管理可以通過标準化、人們熟知的工具,包括OpenManage Systems Administrator(OMSA)和指令行界面(CLI)

Dell對BOSS方案的官方評價是:靈活、備援、低成本的啟動優化解決方案,因為它的目标就是替代2.5寸SATA SSD系統盤,以及對SAS RAID卡連接配接能力的占用。

與Dual SD Module有何異同?

熟悉Dell伺服器的朋友應該知道,PowerEdge還有一種作業系統部署位置選擇——Dell Internal Dual SD Module(IDSDM),我們習慣把它叫做雙SD子產品。

SD和MicroSD(TF)存儲卡占用的空間顯然更小,Dual SD Module目前常見的16GB、32GB容量比較适合于安裝VMware Hypervisor(ESXi,下文中還會談及)。但我們也注意到該方案存在的一些限制:除了容量之外,包括性能和閃存的壽命與SSD有差距,對于一部分Windows或者Linux系統盤就不見得合适了。

對超融合(HCI)、軟體定義存儲(SDS)的意義

下面我從VMware工程師蘇旭的文章《vSAN推薦的IO控制器的配置方式》中引用了一張圖。

在以上6種方案中,“VMware極力推薦并支援Solution4,如果伺服器是R730xd,支援Solution 3;不支援Solution 1和Solution 2;VMware不推薦Solution 5和Solution 6。注意不推薦的原因是ESXi屬于單點,但仍可使用,出問題VMware也是支援的。”

Dell H730系列RAID卡屬于PERC9家族,支援Pass-Through直通即HBA模式,并支援一部分RAID另一部分盤直通的配置。但《vSAN_6.0設計和優化指南》明确指出過:不要為vSAN和非 vSAN 磁盤混合使用不同的控制器模式,這就好像Oracle官方不認證OVM以外x86虛拟機環境。當然還有更“霸道”一點的,比如Windows Server 2016自帶的分布式存儲Storage Spaces Direct(S2D),RAID卡(比如H730、H330)完全設定為HBA都不允許,隻能用HBA330這樣的卡。

一些存儲軟體喜歡直接控制到底層磁盤/SSD,不希望RAID卡在中間中再做個單盤RAID 0啥的。我們看到Solution 3就是用H730 Mini專門做Hypervisor的RAID 1,另外一塊H730P配置為HBA模式給vSAN直通用。前提是PowerEdge R730xd的背闆支援Split拆分模式,但H730 Mini這樣用多少感覺有點浪費?

在Solution 4和6中的Dual SD Module有一點注意事項——“需要手動指定LOG 存儲的永久位置,不要把主機的日志輸出指向vSANDatastore”,如果是硬碟/SSD安裝ESXi日志則可以直接放本地。至于SATA DOM,在伺服器大廠的推薦配置中出現的不太多,其供應來源和品質容易出現一些問題。特别是小容量的SATA DOM盤,如果存儲軟體需要頻繁修改根盤上的中繼資料/Super block之類的,一般用于制造U盤的消費級MLC、TLC閃存顆粒很容易用壞。相比之下,120GB/240GB入門級資料中心SSD的表現就要好很多了。

綜上所述,PowerEdge 14G伺服器的Boot Optimized Storage Solution,雙M.2 SSD用于vSAN、微軟S2D、ScaleIO或者Ceph存儲軟體的系統盤,應該都是很合适的。

先寫到這裡吧,距離Xeon SP伺服器新品釋出還有一段時間,我如果看到什麼好東西再跟大家分享。

參考資料

http://en.community.dell.com/techcenter/extras/m/white_papers/20444059/download

繼續閱讀