spark是一個快速的、通用的大資料叢集計算系統。 它提供了高層api接口(支援scala,java及python)以及一個優化過的支援圖計算和資料處理的引擎。 同時它也一些進階工具也提供了支援,包括對sql及結構化資料處理的spark sql, 機器學習的mllib, 圖像處理的graphx和實時流處理的spark streaming
spark是一個快速的、通用的大資料叢集計算系統。 它提供了高層api接口(支援scala,java及python)以及一個優化過的支援圖計算和資料處理的引擎。 同時它也一些進階工具也提供了支援,包括對sql及結構化資料處理的spark sql, 機器學習的mllib, 圖像處理的graphx和實時流處理的spark streaming