天天看點

你想快速成為大資料工程師?

學習大資料沒有零基礎入門,首先你要成爲一名工程師

在技術論壇中或知乎上,看到近幾萬的冤家都在疑惑,學習Java應該選擇什麼展開方向,這個我們在之前的文章中有提到過,Java展開在範圍上有三個選擇方向:

分享之前我還是要舉薦下我自己建立的大資料學習資料分享群710219868備注風火

這是全國最大的大資料學習交流的地方,2000人聚集,不管你是小白還是大牛,

小編我都挺歡迎,今天的已經資訊上傳到群檔案,不活期分享幹貨,

JavaEE,主要運用于企業級運用開發;安卓開發方向;嵌入式運用開發方向。在此建議大家選擇JavaEE方向,由于運用非常普遍,崗位設定也比較多。

Java的職業展開規劃之路我們也曾在(一文闡述Java從初級到初級的學習之路——

)詳細羅列,這裡就不逐一羅列了。

你想快速成為大資料工程師?

但我們曆來沒有讨論過學習Java,難道這輩子就隻能做Java後端開發嗎?隻能在這條路上妥協終究嗎?難道中途沒有其他的選擇嗎?

偶然看法的一個冤家,最末尾是從事Java後端開發的,後來他在專業時間自學成功轉入大資料行業,如今是一名大資料工程師,待遇也比之前好更多。前提是他是一名Java後端開發。

大資料是我們如今比較火的一個展開方向,但是很多教育訓練機構有提到幾個月速成的,小編覺得不是特别靠譜。

緣由有以下:

  1. 大資料是一個重生行業,還不太成熟。
  2. Java展開了将近20年,也沒有說幾個月速成的,最多也就是帶你入門,讓你對Java的知識結構體系有一個明晰的認知,在後期的義務實際時期生長的速度更快。
  3. 大資料的起點要高,并不是所謂的零基礎就可以入門的。
你想快速成為大資料工程師?

我們接上去講述的有關大資料的學習是有條件限制的,首先你需求是一名普通的工程師,假設你是Java工程師的話更好,但假設你是小白的話,那就隻能成爲一名工程師的後再來學習大資料吧。

一、看法大資料

大資料本質其實也是資料,不過也包括了些新的特征,

  • 資料來源廣;
  • 資料格式多樣化(結構化資料、非結構化資料、Excel檔案等);
  • 資料量大(最少也是TB級别的、甚至可以是PB級别);
  • 資料增長速度快。

而針對以上新的特征需求思索很多成果:

例如,資料來源廣,該如何采集彙總?采集彙總之後,又該存儲呢?資料存儲之後,該如何經過運算轉化本錢人想要的結果呢?

關于這些成果,我們需求有相對應的知識處置。

二、大資料所需技藝要求

Python言語:編寫一些腳本時會用到。

Scala言語:編寫Spark順序的最佳言語,當然也可以選擇用Python。

Ozzie,azkaban:定時義務排程的工具。

Hue,Zepplin:圖形化義務執行管理,結果檢討工具。

Allluxio,Kylin等:經過對存儲的資料中止預處置,加快運算速度的工具。

你想快速成為大資料工程師?

必需掌握的技藝:

Java初級(虛拟機、并發)、Linux 基本操作、Hadoop(HDFS+MapReduce+Yarn )、 HBase(JavaAPI操作+Phoenix )、Hive(Hql基本操作和原理了解)、 Kafka、Storm/JStorm、Scala、Python、Spark (Core+sparksql+Spark streaming ) 、輔佐小工具(Sqoop/Flume/Oozie/Hue等)

高階技藝6條:

機器學習算法以及mahout庫加MLlib、 R言語、Lambda 架構、Kappa架構、Kylin、Alluxio

三、學習規劃

每天需求有3個小時的學習時間,周末的時分需求10小時,假設做不到的話,隻能是

第一階段(基礎階段)

  1. Linux學習

    Linux作業系統引見與安裝、Linux常用指令、Linux常用軟體安裝、Linux網絡、 防火牆、Shell程式設計等。

  2. Java 初級學習(《深化了解Java虛拟機》、《Java高并發實戰》)

    掌握多線程、掌握并發包下的隊列、掌握JVM技術、掌握反射和靜态代理、了解JMS。

  3. Zookeeper學習

    Zookeeper分布式協調效力引見、Zookeeper叢集的安裝部署、Zookeeper資料結構、指令。

第二階段(攻堅階段)

Hadoop、Hive、HBase、Scala、Spark、Python

第三階段(輔佐工具工學習階段)

Sqoop、Flume、Oozie、Hue這些工具的學習主要在CSDN,51CTO以及官網都可以學習。

四、學習資源舉薦

  1. Apache 官網(//apache.org/)
  2. Stackoverflow(https://stackoverflow.com/)
  3. Github(https://github.com/)
  4. About 雲 ://www.aboutyun.com/
  5. CSDN(//www.csdn.net/)
  6. 51CTO (//www.51cto.com/)
你想快速成為大資料工程師?

總結

在技術行業裡面,每天都會有新的東西出現,需求關注最新技術靜态,不時學習。任何普通技術都是先學習實踐,然後在實際中不時完善實踐的程序。

  • 假設你覺得自己看書效率太慢,你可以網上搜集一些課程。
  • 快速學習的才幹、處置成果的才幹、溝通才幹在這個行業是真的非常重要的目的。
  • 要擅長運用StackOverFlow和Google來幫助你學習程序遇到的成果。

以上是我們對大資料學習的總結,當然我們也提到了,并不是說零基礎的就可以直接學習,需求有程式設計的基礎,要先掌握紮實的程式設計基礎,在此建議學習Java,成爲一名工程師的時分,有一定程式設計閱曆,自學起來也相對比末尾要複雜一點,然後對大資料有興味或許想要進入這個行業的就可以去學習了

繼續閱讀