天天看點

美團一面面經--算法工程師

一面:60min

一面内容:

自我介紹 講一下論文和項目

怎麼樣提的特征 做了哪些特征工程

講一下決策樹 随機森林 随機森林的分裂節點的政策(兩個随機);bagging和boosting的聯系和差別; boosting中的adaboost的基本原理; boost中的gbdt的原理 和随機森林有什麼差別 哪個精度更高 為什麼

特征工程有哪些方法(資料處理上的) 主要是統計意義上的一些操作 這塊不足 需要補充 (1.OneHotEncoding 2.标準化 3.歸一化 4.連續特征離散化 5.L1正則 6.GBDT 特征組合 7.特征重要性分析方法 卡方檢驗8.FM實作離散特征embeding)

資料不平衡問題的解決辦法(從資料角度 正采樣和負采樣 從損失函數角度 添加scale平衡資料 從評價角度 用ROC AUC而不用PRC) 解釋ROC PRC 推導公司

l1正則化和l2正則化 解釋 推導 聯系和差別

基礎的機器學習的方法 lr 推導loss函數 推導sgd的參數更新結果 lr和svm的差別

手寫快排加上跟他講解