天天看點

随機森林-解決多重共線性降維進行調參

我們在使用python的随機森林包時,會用到max_feature這個參數

随機森林-解決多重共線性降維進行調參

這個參數是我們進行選擇樣本特征的個數,如果當樣本的特征較多時,比如有50-100個,我們選擇auto,全部特征可以進行降維,即有的特征重要性過低的可以舍去。選擇sqrt可以去除樣本中特征之間多重共線性的幹擾,sqrt代表每次選擇根号n個特征進行建樹。進而減少樣本間多重共線性的幹擾。