天天看点

美团一面面经--算法工程师

一面:60min

一面内容:

自我介绍 讲一下论文和项目

怎么样提的特征 做了哪些特征工程

讲一下决策树 随机森林 随机森林的分裂节点的策略(两个随机);bagging和boosting的联系和区别; boosting中的adaboost的基本原理; boost中的gbdt的原理 和随机森林有什么区别 哪个精度更高 为什么

特征工程有哪些方法(数据处理上的) 主要是统计意义上的一些操作 这块不足 需要补充 (1.OneHotEncoding 2.标准化 3.归一化 4.连续特征离散化 5.L1正则 6.GBDT 特征组合 7.特征重要性分析方法 卡方检验8.FM实现离散特征embeding)

数据不平衡问题的解决办法(从数据角度 正采样和负采样 从损失函数角度 添加scale平衡数据 从评价角度 用ROC AUC而不用PRC) 解释ROC PRC 推导公司

l1正则化和l2正则化 解释 推导 联系和区别

基础的机器学习的方法 lr 推导loss函数 推导sgd的参数更新结果 lr和svm的区别

手写快排加上跟他讲解