對象存儲的優勢
存儲區域網路(SAN)和網絡附加存儲(NAS)是目前兩種主流傳統的網絡存儲架構,而對象存儲(Object-based Storage)是一種新的網絡存儲架構。1999年成立的全球網絡存儲工業協會(SNIA)的對象儲存設備工作組釋出了ANSI的X3T10标準。總體上來講,對象存儲綜合了NAS和SAN的優點,同時具有SAN的高速直接通路和NAS的分布式資料共享等優勢,提供了具有高性能、高可靠性、跨平台以及安全的資料共享的存儲體系結構。
随着非結構化資料爆發式的增長,傳統的SAN和NAS存儲架構不能應對資料爆發帶來的問題。基于其扁平化、拓展性強的結構特點,對象存儲成為非結構化資料存儲的最佳解決方案。通過對象存儲替代傳統的SAN和NAS 存儲,極大提升了非結構化資料通路和存儲的效率。對象存儲具有分布式存儲的所有優點,靈活的拓展性,中繼資料的管理;通過其版本管理的強大功能,對象存儲有效地規避了人為操作的邏輯錯誤。
在性能方面,SAN存儲在處理結構化資料有着不可代替的地位;小容量非結構化資料共享正是NAS存儲發揮作用的場景;對于海量非結構化資料,對象存儲的性能優勢不可比拟。此外,對象存儲成本較SAN和NAS有很大優勢,應對海量檔案,采用對象存儲替代傳統集中式存儲能節省不小的存儲成本,避免了資源浪費。
目前,人們需求的資料越來越多,而其中絕大部分都是非結構化資料。在未來幾年,非結構化更會呈現指數型增長,對象存儲的需求和市場會越來越大,網際網路和傳統行業都離不開對象存儲的發展。
目前對象存儲主流技術和産品
目前,在對象存儲行業存在兩大陣營,分别為開源技術和商用産品。開源技術主要以Ceph為代表,Ceph是一種開源的分布式對象、塊和檔案存儲平台。商業産品中主要以IBM、EMC和HDS三家傳統存儲廠商為市場主流。
兩大陣營:開源和商業
開源技術主要依靠開源社群的貢獻,以Ceph為代表。Ceph 是一個開源的分布式存儲系統,包括對象存儲、塊裝置、檔案系統。它可靠性高、管理友善、伸縮性強,能夠輕松應對PB、EB級别資料。Ceph 存儲體系中,核心為 RADOS,它是一個高可用分布式對象存儲,該子產品負責對叢集衆多 OSD 的運作,保證存儲系統的可用性,為應用提供 RESTful 類型的對象存儲接口,其接口方式支援 S3 和 Swift 兩種類型。
近些年,越來越多的企業嘗試使用Ceph存儲,并基于Ceph建立統一的對象存儲資源池,用來解決近幾年讓企業頭疼的CM内容管理平台。企業采用Ceph搭建對象存儲架構,主要考慮到Ceph作為相對成熟的開源軟體,其技術成本相對低廉;Ceph在開源領域被廣大客戶接受和追求,使用者之間可以互相溝通技術細節和問題處理方法,擁有廣大客戶群體也是Ceph被越來越多企業使用的出發點之一。
商業陣營主要由成熟的存儲廠商研發産品。商業産品依靠其強大的研發團隊不斷根據客戶需求和使用回報對産品進行更新和換代,商業陣營深入客戶,發掘客戶并能夠根據客戶的特點開發存儲産品。商業産品更符合客戶要求,操作簡便,易維護,商業團隊會為客戶的正常運作保駕護航。
從架構上來講,開源技術和商業産品均采用分布式架構,可靈活進行橫向擴充,滿足使用者對大資料量的需求。
以Ceph為代表的開源技術,核心為RADOS,RADOS的架構圖如下圖,由Monitor+OSD節點搭建而成。

商業産品通常采用通路節點+計算節點+存儲節點的部署方式,更具扁平化的結構,不同節點各司其職,有機構成整個對象存儲的系統。開源對象存儲技術以純軟體方式部署,安裝軟體于客戶的伺服器中,通過調試進行對外服務;商業産品既可單獨采購純軟體方式,更可以采購一體機方式,節省了自身部署的複雜度。
開源技術目前對跨站點部署支援有限,還不能完美的進行跨站點部署;商業産品跨站點技術更為成熟,均可進行跨站點跨資料中心的部署,能夠為客戶提供容災方案,避免站點級單點故障,安全性更高。資料可靠性方面開源技術采用多副本技術,通常采用三副本,這樣的架構帶來了存儲成本的上升;商業産品采用糾删碼技術,既能避免邏輯錯誤,也能節省存儲開銷成本。
運作維護方面,開源技術主要依靠客戶的運維能力,需要很強的應急處理能力,運維成本相對較高;商業産品由廠商高水準團隊對客戶負責,可以根據客戶的情況“因地制宜”,制定最合适的運維團隊,及時有效的處理應急情況,保障客戶的系統穩定運作。
商業陣營幾大産品
商業産品陣營中主要以IBM、EMC、HDS為代表,擁有豐富的存儲開發經驗以及完整的開發和維護團隊。
IBM的對象存儲為IBM Cloud Object Storage,簡稱COS,被IBM收購以前叫Clever Safe。架構方面采用管理節點+通路節點+存儲節點的完全分布式架構,資料在通路節點進行切片,平均分布在存儲節點的磁盤中,更細顆粒度的保護資料完整性;硬體方面可以采用IBM定制機,也可以采用客戶自身的經IBM認證的X86伺服器,靈活高效,也可以對伺服器進行利舊處理;COS容量擴充方面極其優秀,叢集可擴充到EB級别,滿足客戶的未來發展需求;支援跨站點的部署方式;資料保護方面采用靈活多變的糾删碼技術,客戶可根據自身的需求調整資料可靠和容量利用的最優配置設定;支援資料加密、多版本管理以及防篡改的進階功能,有效保障資料的可靠性;協定方面除支援Swift和S3協定外,還支援IBM特有的simple object的接口協定;資料讀寫性能可達到數Gb/s的讀寫速度;Gartner和IDC排名連續多年排名第一。
EMC的對象存儲為ECS,架構采用分布式雲存儲平台,通過軟體實作X86伺服器系統的大規模拓展管理,最大容量可達PB級别;支援跨站點的部署方式;提供兩種糾删碼技術,12D+4P和10D+2P兩種方式,對應的容量開銷分為1.33和1.2;協定方面支援Swift和S3兩種方式;市場占有率位于上司者象限;
HDS的對象存儲為HCP,架構采用典型的分布式一體化方式,采用管理計算節點+存儲節點的部署方式;HCP硬體配置靈活多樣,整體存儲節點通常能擴充至400PB;HCP支援多站點部署的同時,可以實作站點間資料傳輸和容災備份;資料保護方面采用20D+6P的糾删碼技術,能夠提供77%的容量使用率;具備多版本、重複對象删除和壓縮功能;協定方面支援Swift和S3兩種方式;資料傳輸方面HCP提供萬兆網絡,可提供GB級别的處理能力;Gartner排名連續三年排名前三。
金融行業存儲規劃選型分析
倘若企業非結構化資料未來增長緩慢,目前的存儲結構滿足業務響應的需求,尚可以采用NAS存儲。在傳統的金融行業中,錄音錄像系統以及内容管理平台系統的推廣帶來了海量非結構化資料飛速增長,傳統的NAS存儲自身為樹形結構,響應速度不能滿足業務發展,此時,對象存儲是企業的最佳選擇。
新興的網際網路金融行業根據其業務特點,更多采用開源技術,通過自身技術人員的運維能力維護開源産品的運作,降低運維成本。在傳統金融行業中,非結構化資料量巨大且繼續呈現增長趨勢,業務連續性需達到監管要求,企業普遍采用商業産品。傳統金融行業非結構化檔案達到億級别,資料量普遍達到PB級别,有些企業未來會達到EB級别,采用商業産品才可以滿足企業需求;商業産品擁有完整的技術支撐,提升企業的業務連續性和資料可靠性。良好的UI操作界面也是商業産品被企業接受的另一優點。成熟的體系架構、靈活的容量拓展、糾删技術的運用,是商業對象存儲未來占據更多市場的堅實基礎,非結構化資料性能問題随着對象存儲的推廣找到了合适的解決辦法。
企業應根據業務特點進行合理的存儲使用規劃。傳統的資料庫型結構化資料采用SAN存儲,達到業務的快速響應;少量樹形結構的資料可采用NAS存儲,達到業務資料共享的目标;海量非機構化資料采用對象存儲,由于對象存儲使用S3或Swift通路協定,傳統的業務系統需要調整業務通路端口,企業可采用“兩步走”的步驟,對于新開發的業務系統,對非結構化資料的通路直接采用對象存儲的方式,對于存量的業務系統逐漸調整通路端口。
合理的存儲使用規劃一定會為企業帶來長久的收益,存儲性能得到了提升,業務響應時間得到了有效的提高,對企業的服務水準和口碑具有良好的推動作用。合理的存儲規劃為企業降低了存儲開銷成本,根據業務特點和需求使用合理的存儲,避免了SAN存儲的浪費,同時采用對象存儲對企業的科技創新開辟了嶄新的道路。