必須技能10條:
01.Java進階(虛拟機、并發)
02.Linux 基本操作
03.Hadoop(此處為俠義概念單指HDFS+MapReduce+Yarn )
04.HBase(JavaAPI操作+Phoenix )
05.Hive(Hql基本操作和原理了解)
06.Kafka
07.Storm
08.Scala需要
09.Python
10.Spark (Core+sparksql+Spark streaming )
高階技能6條:
11.機器學習算法以及mahout庫加MLlib
12.R語言
13.Lambda 架構
14.Kappa架構
15.Kylin
16.Aluxio
二、學習路徑
第一階段:
01.Linux學習(跟鳥哥學就ok了)
02.Java 進階學習(《深入了解Java虛拟機》、《Java高并發實戰》)
第二階段:
03.Hadoop (董西成的書)
04.HBase(《HBase權威指南》)
05.Hive(《Hive開發指南》)
06.Scala(《快學Scala》)
07.Spark (《Spark 快速大資料分析》)
08.Python (跟着廖雪峰的部落格學習就ok了)
第三階段:
對應技能需求,到網上多搜集一些資料就ok了,
我把最重要的事情(要學什麼告訴你了),
剩下的就是你去搜集對應的資料學習就ok了
當然如果你覺得自己看書效率太慢,你可以網上搜集一些課程,跟着課程走也OK 。這個完全根據自己情況決定。如果看書效率不高就很網課,相反的話就自己看書。
三,學習資源推薦:
01.Apache 官網
02.Stackoverflow
04.github
03.Cloudra官網
04.Databrick官網
05.過往的記憶(技術部落格)
06.CSDN,51CTO
07.至于書籍當當一搜會有很多,其實内容都差不多。