天天看點

全閃存資料中心是什麼樣子的?

随着技術的進步和存儲媒體的成本不斷降低,全閃存資料中心的概念也曆經了多年的演變。結果就是,幾乎每一家全閃存存儲廠商都宣布,他們已經推出“實際成本”和基于硬碟的存儲系統相當的閃存存儲産品。

如果你選擇相信廠商們宣稱的硬碟成本對比邏輯并推而廣之,結論就會是:任何組織都沒有理由拒絕全閃存存儲。想象一下,一個能瞬間響應每個io請求的資料中心,而且完全無需區分資料類型!資料管理和性能優化的難題将一掃而光!全閃存存儲系統的未來一片光明!總的來說,閃存媒體的每gb成本持續走低,同時,管理這些存儲系統的軟體技術也提供越來越高的可靠性。存儲系統軟體也在演變,利用更多線程充分發揮多核處理器的性能,以更經濟高效的途徑解放閃存的性能。

全閃存資料中心的障礙

在現實中,任何關于價格的考慮都會成為建設單一閃存層的障礙。首先,廠商隻會把價格和高性能的硬碟系統作對比,而不是和更具成本效益的大容量系統對比。其次,大多數全閃存廠商都針對塊級資料設計他們的存儲陣列。某些産品會整合nas功能,也有産品會整合對象存儲,迅速成為存儲由計算機生成的非結構化資料的新選擇。雖然也有例外,但是通常情況下,大部分非結構化資料使用場景并不能充分利用閃存性能。閃存幾乎總是資料塊存儲的最優選擇,卻并不總是适合nas或對象類型存儲,對後者而言硬碟驅動器往往是更好的高成本效益之選。第三,即使是閃存存儲,也有多種不同的閃存媒體,分别适合不同的使用場景。

然後是資料。即使組織不斷産生和存儲越來越多的資料,然而在資料的最初建立和修改階段過後,實際上大多數資料永遠都不會被再次通路。但是無論如何,我們還是必須要保留這些資料“以防萬一”。如果沒有更便宜的選擇,用閃存來保管全部資料也并無不妥。隻要確定“萬一”的狀況真的發生時,資料能夠立即可用就行。

問題在于,即使全閃存資料中心的擁護者也無法否認有更便宜的替代方案,具體來說有三種:錄音帶,大容量硬碟和雲。這些方案都有其缺點:錄音帶的使用成本并不低,雲會引入新的安全問題,并且如何将資料從全閃存存儲層遷移到這些目标存儲也是管理上的難題。但毫無疑問,将舊資料遷移到舊的低速存儲層肯定可以節省成本。

這就又把我們帶回最初的問題:“多少閃存才算夠用?”答案是——對于it團隊而言——總是要看情況再說。通常,隻要能找到便宜的替代品就盡量少用閃存。要真正實作這些節省,你還需要設法驅動資料在高性能存儲和廉價存儲之間盡可能平滑地遷移。如果資料透明遷移無法實作,那麼部署一套廉價存儲層節省的錢就會很快變得毫無意義。

這也意味着,你的資料遷移政策的有效性将成為全閃存資料中心的決定因素。

高效的資料遷移政策

将非活動資料從昂貴的存儲層移動到相對便宜的存儲層,這種想法從幾十年前就已經存在了。問題在于,過去的大多數資料遷移方法都極其繁瑣,并且it專業人員認為管理這些資料的投入和收益不成比例。但情況在最近這幾年有了改變,在存儲層之間遷移資料已經司空見慣,非常容易實作和管理。

簡化資料遷移的第一步就是:引入混合存儲系統。這類存儲系統會在系統内部移動資料,典型的操作就是把資料從小容量的閃存層移動到大容量的硬碟層。有意思的是,大多數混合存儲廠商現在也提供全閃存産品,并且都聲稱他們的全閃存存儲銷量超過混合存儲系統。

某些廠商指出,他們的全閃存儲産品賣得比混合存儲系統好,印證了全閃資料中心的轉型趨勢。由于混合存儲系統适合許多環境,全閃存就顯得更有吸引力。混合存儲的挑戰是,必須能按需同時提供全閃存的性能和硬碟存儲的性能。由于混合存儲系統内部架構(計算、記憶體、網絡)必須和高性能的閃存配套,這些高速内部元件的成本必然超過那些隻需要對付硬碟性能的普通存儲陣列。

某些更前衛的全閃存存儲廠商會宣稱,為了滿足高性能、線上或近線資料等多種需求,完全使用閃存的系統才是優選。未來的混合存儲系統将管理不同類型的閃存,而不隻是管理閃存和硬碟。

盡管仍有關于冷資料的争議,但一定會有更經濟的辦法去存儲這些資料。一套存儲系統混用各種陣列努力實作更好看每gb成本名額,這就催生了一套專門的技術體系。資料中心必須擁有一套政策驅動機制,基于政策在不同類型的存儲系統之間移動資料。好消息是,已經有大量實作這些政策的軟體湧現。

硬體無關的資料遷移

硬體無關的資料遷移有多種實作方式。第一種就是全局檔案系統。這是一類跨越多個實體存儲硬體的分布式檔案系統,基于政策在節點之間移動資料。能充當全局檔案系統節點的硬體類型幾乎沒有限制,大多數支援在閃存和磁盤系統之間移動資料,某些支援将資料移動到雲(私有或公有雲),甚至支援移動到錄音帶媒體。由于全局檔案系統是增強版的檔案系統,他們對nfs或者smb挂載方式的支援有一些限制。要實作支援,所有充當全局檔案系統節點的存儲硬體都必須具備建立nfs或者smb共享資源的能力。

和全局檔案系統不同的是,某些公司開發了一類新的硬體無關資料移動方式,例如 primary data、iofabric 和strongbox。他們的軟體不要求所有資料都位于共享檔案夾,也不要求所有節點存儲硬體提供nfs或者smb共享資源。有些産品甚至能聚合塊級存儲或對象存儲系統資源,并實作這些系統之間的資料移動。

針對容量和性能場景,硬體無關的資料遷移技術讓你可以用較低的成本部署全閃存陣列,提升活動資料的性能;同時使用容量優先的存儲系統承載非活動資料。這些技術會依照組織建立的政策在不同的系統負載之間透明地移動資料,最常見的政策就是“如果資料在規定的天數内沒有通路記錄,則把該資料從閃存陣列移動到大容量存儲”。

結果就是,滿足(少量)活動資料性能要求的全閃存陣列成本與硬碟陣列相當,而且非活動資料仍然可以使用廉價的替代存儲。在提供相同容量的情況下,高容量硬碟陣列、對象存儲、公共雲存儲,甚至錄音帶的平均價格都比閃存陣列更低。全閃存資料中心更加需要用心決策哪些資料應該駐留在何處,以及如何将這些資料移動到昂貴的閃存之外的、遍布資料中心内的替代存儲。基于這一立場,你就無法忽略大容量存儲産品的成本效益,更何況向這些存儲無縫遷移資料已經極其容易。

是以,大多數資料中心會針對最活躍和次活躍的資料配置最多相當于總容量20%的全閃存陣列。資料中心另外80%的存儲容量則采用側重容量的存儲——高容量nas、對象存儲或公共雲存儲。

嚴格說來,所謂全閃存資料中心應該叫做“五分之一閃存”資料中心才對。

本文轉自d1net(轉載)