使用Hadoop和Spark的大資料分析大緻分為兩大類:資料分析和資料科學。資料分析側重于過去和現在的統計,而資料科學側重于未來的統計。資料科學項目本質上是疊代的,而資料分析項目則不是疊代的。
Apache Hadoop為你提供了分布式存儲和資源管理,Spark為你提供了大資料分析的記憶體級性能。在大資料分析中,需要根據用例的類型及其可行性來使用各種工具和技術。
下一章将幫助你開始學習Hadoop和Spark。
使用Hadoop和Spark的大資料分析大緻分為兩大類:資料分析和資料科學。資料分析側重于過去和現在的統計,而資料科學側重于未來的統計。資料科學項目本質上是疊代的,而資料分析項目則不是疊代的。
Apache Hadoop為你提供了分布式存儲和資源管理,Spark為你提供了大資料分析的記憶體級性能。在大資料分析中,需要根據用例的類型及其可行性來使用各種工具和技術。
下一章将幫助你開始學習Hadoop和Spark。