最近處理資料的時候嘗試了一下特征選擇,在此記錄一下常用的方法,以便日後查閱:
先貼一下原始資料:
1.RFE特征選擇
2.方差分析
3.互資訊法
4 卡方檢驗
5.1嵌入的方法:
基于L1範數:使用帶懲罰項的基模型,除了篩選出特征外,同時也進行了降維
5.2嵌入的方法:
基于樹模型的特征選擇:樹模型中GBDT也可用來作為基模型進行特征選擇,使用feature_selection庫的SelectFromModel類結合GBDT模型
最近處理資料的時候嘗試了一下特征選擇,在此記錄一下常用的方法,以便日後查閱:
先貼一下原始資料:
基于L1範數:使用帶懲罰項的基模型,除了篩選出特征外,同時也進行了降維
基于樹模型的特征選擇:樹模型中GBDT也可用來作為基模型進行特征選擇,使用feature_selection庫的SelectFromModel類結合GBDT模型