天天看點

随機森林算法梳理——任務1

任務内容:

随機森林算法梳理

內建學習的概念

內建學習的關鍵點(中心極限定理):

讓弱學習器互相獨立(算法不同、使用的訓練資料不同、使用的特征不同)。理想狀态下,25個弱學習器中,一個弱學習器的誤差率為0.35,強學習器的誤差率為0.06。

增加更多的基分類器

基分類器應當好于随機猜測分類器,即誤差率小于50%

內建學習中基學習器的誤差率不能超過50%,否則組合分類器的誤差率會大于50%

個體學習器的概念

boosting bagging的概念、異同點

了解不同的結合政策(平均法,投票法,學習法)

随機森林的思想

随機森林的推廣

随機森林的優缺點

随機森林在sklearn中的參數解釋

随機森林的應用場景