天天看點

大資料學習目錄

必須技能10條:

01.Java進階(虛拟機、并發)

02.Linux 基本操作

03.Hadoop(此處為俠義概念單指HDFS+MapReduce+Yarn )

04.HBase(JavaAPI操作+Phoenix )

05.Hive(Hql基本操作和原理了解)

06.Kafka

07.Storm

08.Scala需要

09.Python

10.Spark (Core+sparksql+Spark streaming )

高階技能6條:

11.機器學習算法以及mahout庫加MLlib

12.R語言

13.Lambda 架構

14.Kappa架構

15.Kylin

16.Aluxio

二、學習路徑

第一階段:

01.Linux學習(跟鳥哥學就ok了)

02.Java 進階學習(《深入了解Java虛拟機》、《Java高并發實戰》)

第二階段:

03.Hadoop (董西成的書)

04.HBase(《HBase權威指南》)

05.Hive(《Hive開發指南》)

06.Scala(《快學Scala》)

07.Spark (《Spark 快速大資料分析》)

08.Python (跟着廖雪峰的部落格學習就ok了)

第三階段:

對應技能需求,到網上多搜集一些資料就ok了,

我把最重要的事情(要學什麼告訴你了),

剩下的就是你去搜集對應的資料學習就ok了

當然如果你覺得自己看書效率太慢,你可以網上搜集一些課程,跟着課程走也OK 。這個完全根據自己情況決定。如果看書效率不高就很網課,相反的話就自己看書。

三,學習資源推薦:

01.Apache 官網

02.Stackoverflow

04.github

03.Cloudra官網

04.Databrick官網

05.過往的記憶(技術部落格)

06.CSDN,51CTO

07.至于書籍當當一搜會有很多,其實内容都差不多。