天天看點

大資料架構師訓練營學習筆記

1.數學及統計學相關的背景

百度首席資料科學家沈志勇認為,缺乏理論背景的資料工作者,更容易進入一個技能上的危險區域(Danger Zone)—一堆數字,按照不同的資料模型和算法總能捯饬出一些結果來,但如果你不知道那代表什麼,就并不是真正有意義的結果,并且那樣的結果還容易誤導你。“隻有具備一定的理論知識,才能了解模型、複用模型甚至創新模型,來解決實際問題。”

2.計算機編碼能力

實際開發能力和大規模的資料處理能力也被認為是作為大資料工程師的必備技能。“因為許多資料的價值來自于挖掘的過程,你必須親自動手才能發現金子的價值。”鄭立峰說。

舉例來說,現在人們在社交網絡上所産生的許多記錄都是非結構化的資料,如何從這些毫無頭緒的文字、語音、圖像甚至視訊中攫取有意義的資訊就需要大資料工程師親自挖掘。即使在某些團隊中,大資料工程師的職責以商業分析為主,但也要熟悉計算機處理大資料的方式。

3.對特定應用領域或行業的知識

大資料不能脫離市場,因為大資料隻有和特定領域的應用結合起來才能産生價值。是以,在某個或多個垂直行業的經曆形成了你對該行業的認知,對于之後成為大資料工程師有很大幫助,是以這也是應聘這個崗位時較有說服力的加分項。你不能隻懂資料。還要對某些行業有深入的了解。最好是契合你們公司的業務方向的。

如果是想要從事技術方向的話,上面很多高贊回答的學習路徑都很詳細了,如果是想要從事業務方向的大資料分析工作的話,對于技術背景的要求就沒有那麼高了。目前市場上BI産品已經跨入了智能BI的階段,使用者使用層面強調低代碼(或零代碼)開發、無縫對接、靈活部署,并且,還可以借助AI算法的能力建構基于未來的分析模型,比如銷售預測、智能排課等。也推薦你一款BI産品,Data,我認為是國内目前比較容易上手,對想要入門大資料分析的小白非常友好的産品。

1、獨創搜尋式智能分析。Data是國内第一個采用搜尋的方式進行資料分析的工具,使用方式如同谷歌搜尋一樣,隻需要在輸入框内輸入想要知道的資訊,系統實時地傳回結果,并且智能地适配圖表。

2.高效實用。Data使用過程中無需任何代碼,無IT知識的普通業務人員也能快速上手,圖表類型豐富,制作簡單,滿足企業大部分需求。并且可以自定義可視化大屏,圖表關聯,圖表鑽取,資料定時更新,整合多源資料,清洗資料等等,操作簡單,但是功能不簡單。

Data是有一個月免費試用期,并且有詳細的使用者手冊和視訊教程,對于資料分析小白來說從Data入門真的很合适,畢竟在實踐中才能更快地學習成長。

連結:https://pan.baidu.com/s/1_4PIUb-Yl68aTW9Bw95iJA

提取碼:tnav

繼續閱讀