目錄
- 前言
-
- 技能樹
- 統計學類
- 機器學習算法原理
- 資料處理
- SQL
- 業務例子
- 資料結構與資料類型
- 項目
- 其他
- 時間表
前言
Blog記錄面試學習準備過程與成長過程,崗位主要為資料分析,包括資料挖掘,商業分析,(算法機器學習?)(産品經理?)咨詢等。
技能樹

統計學類
機率的計算,條件機率
假設檢驗,T-test等常用統計檢驗
A/B Test
機器學習算法原理
分類:KNN,DT,Random Forest,GBDT,Xgboost,Lightbgm
SVM,
回歸:Linear,Logistic
聚類:K-means,DBSCAN
PCA,Boost,Bagging,評估名額
其他概念:AUC,KS概念,過拟合,正則化等
資料處理
特征選擇:異常值處理,特征提取。
SQL
跨表查詢
大量資料
日期時間
運作中問題:如查詢較慢,出現異常等
示例
select * from
table as tab
join usertable as user
on tab.user_id = user.id
where
group by
def zero():
return 0;
業務例子
使用者推薦算法(面試)
使用者行為分析:點選,留存
以上行為的評價名額
4月營業額為什麼比3月高/低,分析原因并提出政策
4月使用者為什麼比3月高/低,分析原因并提出政策
使用者調研,解決方案等
資料結構與資料類型
二叉樹,排序,節點相似度balabala
程式設計Leetcode,劍指Offer,牛客等
項目
項目+思路細節+算法,在其中做出了哪些貢獻,其中遇到的最大的困難,為什麼不用某某算法,該算法與其他算法的優劣勢在哪裡
其他
自我介紹一下
為什麼選擇本公司
為什麼選擇XX(資料)崗
為什麼不選擇XX(算法,商分,挖掘等)崗
時間表
- 關于 甘特圖 文法,參考 [這兒][2],