天天看點

《Spark與Hadoop大資料分析》——1.5 小結

使用Hadoop和Spark的大資料分析大緻分為兩大類:資料分析和資料科學。資料分析側重于過去和現在的統計,而資料科學側重于未來的統計。資料科學項目本質上是疊代的,而資料分析項目則不是疊代的。

Apache Hadoop為你提供了分布式存儲和資源管理,Spark為你提供了大資料分析的記憶體級性能。在大資料分析中,需要根據用例的類型及其可行性來使用各種工具和技術。

下一章将幫助你開始學習Hadoop和Spark。

繼續閱讀