目錄
前言
軟體定義存儲
前言
0.通俗講是SDS
即存儲軟體和硬體不綁定,軟體不是作為儲存設備中的固件,而是在一個伺服器上或者作為作業系統(OS)或hypervisor的一部分。軟體是核心,可以裝在其他裝置上就稱為儲存設備。
連結:https://www.zhihu.com/question/38772516/answer/83728934
軟體定義存儲是個為了炒作而炒作的商業化概念,也就是“可以安裝在任何開放式伺服器系統上的軟體的存儲系統”。這個概念直指傳統廠商的封閉式SAN存儲系統,它們的軟體隻能運作在經過層層認證篩選測試的硬體上,并不是說後者就不能運作在開放式标準化的硬體上,而是說後者為了形成各方面的門檻壁壘,故意去定制化特殊的硬體,在底層通過識别各種資訊來排除使用者私自使用未經篩選認證的标準化硬體,比如使用者不能從市場上任意購買SAS/SATA硬碟來插到傳統SAN存儲系統中,并不是接口不相容,而是軟體識别為第三方自購硬碟,不以使用。後者這麼做的原因是極力保證系統的穩定性。當然,本質目的其實還是形成壁壘。而SDS則是民間自發形成的利用開源軟體架構(多半都是分布式架構,因為這樣實作最簡單)+标準化硬體做一些二次開發形成的存儲系統,它們的可靠性一定是不如傳統SAN的,但是SDS可以使用野路子來規避底層的各種不穩定因素,比如資料直接寫多份,一有不穩定直接切換到其他節點,而根本不用管為什麼不穩定。之前節點reset,重新加入叢集後rebuild/sync就行。而傳統SAN,則必須搞清楚什麼原因導緻的不穩定。這種粗枝大葉的方式,導緻SDS用在核心關鍵業務中還需要很長一段時間。用在外圍業務中倒是可以節省成本。
連結:https://www.zhihu.com/question/274834127/answer/376922746
軟體定義存儲
1.SDS科普
SDS(Software Defined Storage)即軟體定義存儲,簡單地說就是将存儲硬體和軟體進行分離,采用标準化硬體作為載體(如X86架構),基于軟體實作企業級存儲功能和服務。相對于傳統存儲硬體盒子,SDS中存儲軟體成為了核心。SDS通常都是分布式存儲,形式分為檔案存儲(POSIX/NFS/CIFS)、對象存儲(S3)和塊存儲(iSCSI/iSER/NVMeoF)三種。

SDS的興起源于硬體的快速發展,CPU、網絡、SSD等硬體成熟度、穩定性、性能不斷提升,同時雲計算對存儲擴充性、可靠性、高性能、低成本的迫切需求,進而使得SDS成為可能。
從雲計算到傳統行業,從邊緣到核心業務,SDS目前已經成為存儲市場主流,替換傳統SAN/NAS存儲,即去IOE運動。SDS的産品模式分為獨立存儲和HCI超融合兩種,後者中SDS決定着HCI的核心競争力。
SDS開源軟體和商業系統,可謂百家争鳴,多為面向HDD機械硬碟或SSD混合型容量存儲。随着SSD技術和成本不斷演進,新一代性能型全閃SDS即将成為主流趨勢。同時,智能化SDS發展趨勢凸顯,即第五代智能存儲。
2.發展簡史
2003年,Lustre 1.0釋出,一款面向HPC的開源高性能叢集并行檔案系統。
2006年,Gluster誕生,最初目标是代替Lustre和GPFS分布式檔案系統。
2009年,Nutanix公司釋出具有專利的超融合基礎架構,公認為HCI鼻祖。
2010年,Sheepdog釋出,一款極簡風格的開源分布式塊存儲系統。
2011年,Sage Weil創立了Inktank公司主導Ceph的開發和社群維護。
2012年,Pure Storage釋出第一代AFA全閃存陣列,引領全閃存儲潮流。
2014年,VMWare正式釋出VSAN第一個版本,内嵌于vSphere核心中。
2014年,FhGFS改名為BeeGFS,并在中小型HPC系統中得到關注和應用。
2014年,MinIO釋出,一款極簡風格的開源高性能分布式對象存儲系統。
2015年,這年前後中國湧現一批基于開源Gluster/Ceph/BeeGFS的存儲初創公司。
2015年,被普遍認為是中國SDS/HCI市場的元年,整個市場呈現高速增長的局面。
2017年,Qumulo釋出新一代高性能全閃存檔案存儲系統,面向百億級别檔案數量應用。
2017年,這年前後中國湧現一批巨頭入場,基于開源Ceph研發SDS存儲産品。
2019年,根據IDC統計數字SDS/HCI已經成為市場主流,占據超過1/3外部存儲市場佔有率。
2020年,信創産業開始将SDS納入産品名錄,中國市場出現新一代性能型全閃SDS産品。
3.技術流派
本身SDS産品技術路線而言,國内開源存儲占了大多數,分為六大技術流派,各顯神通。
Lustre, 開源高性能并行檔案系統,波瀾不驚的20+年發展曆程,常青樹标杆。
Lustre最大特點就是可擴充的高性能,尤其TB級超高帶寬,以及MPI并行支援。
Lustre缺陷同樣非常明顯,系統複雜性極高,資料可靠性過度依賴硬體。
Lustre專注高性能并行計算場景,幾乎占據HPCTOP500半壁天下。
Lustre正在發展全閃存架構、叢集中繼資料、副本/糾删碼備援機制,以突破更高帶寬、百億級小檔案、Share-nothing架構下資料高可用等挑戰。
Gluster,極簡架構的開源分布式檔案系統,目标是替換Lustre/GPFS,最為廣泛流行。
Gluster,最大特點是簡單可靠,獨特去中心架構下的高彈性擴充能力,更低硬體要求。
Gluster最明顯的不足是海量檔案下的中繼資料檢索能力,小I/O能力不太夠。
Gluster非常适合大檔案帶寬型應用場景,比如媒體資源、視訊監控、HPC,适用面寬泛。
Gluster正在優化大規模叢集管控、海量中繼資料管理、容器持久化存儲、混合雲存儲等功能,以拓寬更多的應用場景。
Sheepdog,極簡架構的開源分布式塊存儲系統,專為KVM/QEMU設計,昙花一現。
Sheepdog最大特點同樣是簡單易用,無中心架構擴充能力強,專注做好塊存儲功能。
Sheepdog顯著短闆是進階存儲特性不足,背後無公司營運,系統穩定成熟度不夠。
Sheepdog專為QEMU虛拟機設計,适用OpenStack,也可作為獨立iSCSI塊儲存設備。
Sheepdog起了個大早,2015年前後曾經發展勢頭很不錯,2018年基本停滞,甚是可惜。
Ceph,開源分布式統一存儲系統,追求完美架構,因OpenStack和對象存儲成為雲計算寵兒。
Ceph最大特點是統一存儲,同時支援塊兒、對象和檔案存儲,進階存儲功能規格全面。
Ceph最大問題同樣是統一存儲,系統架構複雜度極高,檔案功能一直未能達到生産成熟度。
Ceph最佳應用場景是OpenStack,天然生态融合,對象存儲應用比較廣泛已經超越塊存儲。
Ceph正在努力優化其檔案系統成熟度、降低I/O延遲、支援高速網絡和新型存儲媒體,以适應雲計算的快速發展步伐。
BeeGFS,開源高性能分布式檔案系統,Lustre挑戰者,HPC領域存儲新秀。
BeeGFS最大特點是開放硬體架構下的高性能,相對Lustre/GPFS更加靈活易用和更高擴充性。
BeeGFS不足之處是同樣是系統複雜性極高,性能之外的進階存儲功能缺失比較多。
BeeGFS聚焦HPC高性能計算場景(尤其是中小型),目前已經在TOP500/IO500嶄露頭角。
BeeGFS正在發展混合雲化環境檔案存儲服務、全閃存架構性能優化、AI場景化應用優化,以及進階存儲功能,以拓寬HPC高性能計算之外的更多應用場景。
Minio,極簡架構的開源分布式對象存儲系統,AWSS3相容最好的開源實作,對象存儲新貴。
Minio最大特點是輕量可靠,專注做好對象存儲,獨特擴充模式獲得更高擴充性和易維護性。
Minio被诟病最多的同樣是按叢集擴充模式,單個桶無法擴容,僅支援EC糾删碼延遲較大。
Minio主要應用場景為人工智能、大資料分析、雲原生應用、資料備份容災等。
Minio正在發展對接更多雲生态應用、對象存儲混合雲化服務、高性能硬體環境下的性能優化,更好幫助建構雲原生資料基礎架構,并承載更多關鍵核心應用。
4.技術門檻
存儲圈流傳這樣一個說法,搞存儲是一個危險系數很高的職業。
為啥呢?計算出問題通常都是局部單機故障,重新開機試試大機率就能解決,而存儲一旦出問題就是全局系統故障,搞不好就成背鍋俠。存儲作為IT基礎設施的底座,重要性不言而喻,誰整誰知道。
存儲圈内人士總是對存儲有無窮的敬畏,越是大牛越是如此。而存儲圈外人士往往低估存儲的門檻,認為隻要投錢花時間就能搞出牛逼的存儲産品。這裡面直接忽略了科學理論、工程技術的系統複雜性和人的決定性因素。如果是這樣,哪有什麼卡脖子關鍵技術一說。
存儲系統軟體是一個複雜的系統軟體工程,需要嚴謹的理論架構和工程化來保證資料安全性和系統穩定性,存儲的底線和紅線是不允許丢失資料。存儲算法理論、系統架構、硬體結構、作業系統、軟體工程等各個環節都非常複雜。系統複雜性決定了存儲研發不可能是一件容易的事,對于存儲新産品技術要在無人區不斷摸索和試錯,對理論創新、系統架構、工程化能力要求很高,這些都直接決定了存儲的極高門檻。
就存儲産品技術而言,中國至少落後矽谷一代,時間上真不大好估算,有些技術我們是壓根沒有掌握。國記憶體儲采用開源路線居多,同質化現象極為嚴重,研發上采用Follow對标跟随政策,創新領先的東西極少,并沒有出現類似矽谷百家争鳴的景象。這些同樣佐證了存儲門檻很高,一定要有客觀清醒的認知。
5.全閃SDS
SSD固态硬碟技術成熟度和先進性不斷增強,成本不斷下降,取代大部分HDD機械硬碟是必然結果。第五代智能存儲發展趨勢,全閃滿足不斷提升的性能型場景需求和企業數字化轉型。從存儲顆粒晶片、主要晶片到主要軟體,SSD能夠實作完全國産化,而機械硬碟無法做到,全閃存是信創産業實作國産化存儲替換的必由之路。
2015年被普遍認為是中國SDS/HCI市場的元年,整個市場呈現高速增長的局面,2019年根據IDC統計數字認為SDS/HCI已經成為市場主流,占據超過1/3的外部存儲市場佔有率。同時,全閃存儲(全閃陣列AFA和全閃SDS)成為主流趨勢,占用外部存儲市場的半壁江山。2020可能會成為中國全閃存的發展元年,多家存儲廠商釋出了新一代的AFA全閃陣列,TaoCloud則釋出了FASS新一代性能型全閃SDS産品。
全閃SDS特點是高性能,尤其是随機讀寫、低延遲和高帶寬,主要用于高性能場景。
1) 雲計算:雲基礎設施加速,高速雲存儲,幫助核心業務上雲;
2) 金融科技:資料庫加速,高性能容器存儲,幫助去IOE和國産化替換;
3) 新基建:5G、AI、物聯網、工業網際網路,解決新興行業性能痛點需求;
4) 其他:4K/8K高清非編、HPC、海量小檔案,滿足行業技術更新需求;
全閃存趨勢已經很明顯,全閃和混閃在SDS中占比已經達到50%。分布式全閃存矽谷代表創業公司有Pure Storage、kaminario、Excelero、E8、Qumulo、Wekaio、Elastifile,國内目前全閃SDS産品鳳毛麟角。全閃存如果已經是絕對主流,那意味着再入場可能為時已晚,2020年正當時。
6.免費開源
SDS開源軟體發展繁榮興盛,諸如Lustre、Gluster、Sheepdog、Ceph、BeeGFS、Minio六大技術流派,國記憶體儲廠商或多或少都享受着開源存儲軟體紅利。 開源軟體降低了存儲研發的門檻,基于成熟的開源存儲系統可以快速建構起具有一定競争力的存儲産品體系,實作市場布局和自主可控國産化。借助開源軟體打造存儲,無非是出于幾種考慮,或是看好順應開源大勢,或是圖快吃紅利,或是認為研發成本低,或是沒有能力自主研發。
采用SDS開源存儲軟體同樣面臨諸多巨大挑戰。開源系統本身複雜性高,吃透并且能夠掌握難度是挺大的, 通常都是跟随社群主導者的步伐發展。越是火熱的開源存儲,越是市場上同質化更加嚴重,容易陷入價格戰的惡性競争而非技術取勝,同質化競争導緻市場分散也限制了廠商的發展上升空間。開源軟體需要嚴格遵守開源許可,尤其是走向國際化市場。另外,開源模式并不意味着免費或低成本。
SDS軟體定義存儲的核心是軟體,支援部署在裸金屬、私有雲、公有雲及混合雲上。SDS的理想目标是,簡單穩定好用低成本,發展方向是免費開源軟體和SaaS公有雲化。當然,縱觀開源社群,免費開源的關鍵在于誰來主導,掌控者得大發展(比如Redhat,也有例外), 跟随者吃點紅利小發展。
7.競争格局
國内SDS産品基于開源路線為主,Ceph占絕對多數,其他有Gluster和BeeGFS。幾乎全部都是第一代容量型SDS,落後矽谷一代技術,自研産品少。以下競争格局根據廠商公開資料和存儲圈内資訊整理而成,如有出入敬請撥正。
巨頭企業:
華為:FusionStorage(參考Ceph,塊存儲)、OecanStor 9000(參考Ceph,檔案存儲)
浪潮:AS13000(開源Ceph,重點是檔案存儲)
新華三:OneStor(開源Ceph,塊和對象存儲)
曙光:Parastor(自研,檔案系統,HPC場景)
深信服:EDS(開源Gluster+Ceph,塊存儲、檔案和對象存儲)
初創公司:
TaoCloud:XDFS(開源Gluster,以檔案存儲為主),FASS(自研,新一代全閃塊存儲)
XSKY:SDS系列産品(開源Ceph,塊和對象存儲)
杉岩:SDS系列産品(開源Ceph,塊和對象存儲)
鵬雲:ZettaStor DBS(自研,塊存儲)
霄雲:BOSS(自研,統一存儲)
焱融:YRCloudFile(開源BeeGFS,檔案存儲)
龍存:Loong系列(自研,檔案系統,HPC場景)
8.未來展望
數字世界那麼大,存儲必然有好發展。
2020年可能是全閃存儲發展元年,全閃存已經是大勢所趨,國内市場會加速度發展。
新興技術、産業更新、新基建、信創産業,新興需求驅動細分應用感覺智能存儲發展。
第五代智能存儲,業界基本形成共識,人工智能技術将颠覆存儲技術走向新境界。