天天看點

常見分布式檔案系統大盤點,想了解大資料先從存儲開始

大資料的最底層的内容就是存儲,隻有把資料存在能高效通路的分布式系統下才能提升工作效率。小編帶大家來盤點一下這些常見的分布式檔案系統:

Lustre

Lustre是一個非常安全,規模很大的分布式檔案系統,最早由CFS(Cluster File System Inc.)公司研發,最後由CFS、惠普和因特爾三家公司一起與2003年推出第一版釋出版,發展到現在已經非常成熟。其存儲量通常以PB起步,節點支援數也能打到萬級。但是其對裝置有特殊要求。

HDFS

HDFS是Hadoop内置的分布式檔案系統,之前也有過介紹。HDFS最大的優勢就是價格低廉,是以也使用極為廣泛。并且其高可靠性,高容錯性也讓使用者非常信賴。雖然HDFS的存儲級别也在PB以上,但是對于小檔案過多的情況HDFS不能很好的支援。

QFS

QFS和HDFS類似,都是為了解決高效順序讀寫大量資料的問題。但是QFS在性能上優于HDFS,讀寫效率提升綜合越60%。現在QFS還比較小衆,沒有經過大量的使用測試,是以還不能用于大規模的生産環境。

GlusterFS

GlusterFS也是一個PB級别的叢集檔案系統,其思想是将叢集内所有伺服器的存儲空間彙到一個大的網絡系統上。這樣做最大的特點就是無中心,不會有單點故障。

Alluxio

Alluxio是第一個基于記憶體的分布式檔案系統,是以其相應速度也會超出普通的分布式檔案系統很多,例如HDFS就比它慢數百倍。并且Alluxio和Spark也有良好的互動。最重要的是Alluxio中國人開發的,文檔都是中文的,對于被英文文檔困擾很久的小夥伴絕對是福音。

常見分布式檔案系統大盤點,想了解大資料先從存儲開始

Ceph

Ceph也是一個沒有單點故障的分布式檔案系統,Ceph的每個節點上都有一小部分資源用于計算節點的資料資訊,進而非常優秀的實作負載均衡。

PVFS

PVFS是一個并行虛拟檔案系統,他能很好的支援linux上的原聲指令和工具,例如rm、dd、cat等。但是PSFS是單管理節點的,是以存在單點故障,并且在啟動後無法靈活的修改。

繼續閱讀