天天看點

大資料工程師面試

技術成熟

大資料實踐不夠

大資料大于資料分析

大資料人才企業培養的

核心技能

大資料團隊構成   基礎平台、應用平台、資料應用(使用者畫像、BI、使用者行為分析)

大資料開發工程師 精通各個元件的原理。了解業務的需求,java,scala,hive

資料倉庫工程師  資料模組化,java,hive,python

算法工程師  機器學習算法,使用者畫像,推薦,  

100PB  

數十萬

幾千個節點

面試準備

個人角色的定位

大資料開發工程師

個人職業規劃 2-3年  業務、技術、綜合能力   微調

紮實的基本功  面試的時候要複習   資料結構,Linux,項目管理,開發流程

開發語言  最擅長  兩個,深入到原理  java, python

公司、項目的回顧以及梳理  核心項目梳理清楚   跟求職崗位相關的重點回顧 

業務細節要重視

項目梳理步驟:項目背景、項目設計以及架構、技術選型以及對比、實作的細節、項目的效果

履歷的準備  履歷的内容最好不要超過兩頁,掌握的内容不求全而求精

寫真正擅長的,業務與技術、項目要突出重點  與求職崗位相關的重點描述  

面試技巧

技術面(基本功、技術深度),業務項目面(通過不同項目考核技術的廣度,以及實踐能力),綜合能力面(執行能力,溝通能力,協調能力)、HR面(求職意願、穩定性,抗壓性)

面試要點 常見考核點

Hadoop工程師  元件精通程度,精讀面試相關元件的代碼,并能針對各種應用中遇到的問題快速定位,java是基礎。linux基礎,然後精通某些元件

  &&叢集規模變大,檔案數增多,node記憶體受限成為瓶頸,如何解決。   node水準擴充

   敏感資料的安全保護措施   伺服器通路認證,底層目錄權限管理、hive表的權限管理、三層結合達到目标

   hadoop實戰,java核心技術

大資料開發工程師

    面試要點

    熟練使用相關的元件,針對各個元件在應用中的不同環節進行調優,能夠充分發揮大資料的價值,不同元件有變化,java scala是常見的開發語言  hbase mapreduce storm  

    hbase  rowkey如何設計  結合實際的項目

    如何實作map reduce spout  bolt

    storm并發問題  容災政策

資料倉庫工程師

面試要點  

    熟悉各個元件,資料模組化,資料分層模型,ETL流程,資料品質,資料安全相關知識

    hive建構,相關元件mapreduce  spark hivesql 

    hive mr開發的時候  資料傾斜怎麼辦, 怎麼去優化,怎麼去分析

    資料模組化常用的方法和模型 資料倉庫建設的優點,解決了哪些痛點,數倉規劃 模型設計

    日志系統的ETL環節 具體每一步都做了那些事情  資料品質是如何保證的 

資料分析師

  sql基礎  hivesql python 資料分析項目的流程 采集、整理、資料模組化、分析、報告的産生、行業相關的名額定義

  名額體系 分别是怎麼定義的

算法工程師

    算法理論知識、工程實作能力和編碼水準,業務的了解能力和思考的深度 

    統計學 數學基礎知識 矩陣變換、特征值

    算法方面 各種常見的機器學習算法的原理和差別,常用調優的方法 

    資料結構、搜尋方法

    推導,原理,廣告點選的預估,用了哪些資料,那些算法實作的

大資料職業發展通道,進階之路

叢集規模、公司的業務模式  職業發展的瓶頸    

技術路線  管理  技術型管理

迷茫期  重複工作 差異變化小 沒有職業規劃

30-40歲 黃金階段 業務範圍擴張計劃、技術廣度深度提升計劃、溝通協調,綜合能力

1、開發語言問題  不同崗位對語言要求不一樣 明确的角色定位,然後再掌握語言 

2、轉崗轉行   2-3年職業規劃

3、學曆問題  履歷要求比對。都會給面試機會   

4、自學&教育訓練班  不是很重要,影響不大,看中之前的技能,和之前的項目是否相關或者比對

繼續閱讀