任務内容:
随機森林算法梳理
內建學習的概念
內建學習的關鍵點(中心極限定理):
讓弱學習器互相獨立(算法不同、使用的訓練資料不同、使用的特征不同)。理想狀态下,25個弱學習器中,一個弱學習器的誤差率為0.35,強學習器的誤差率為0.06。
增加更多的基分類器
基分類器應當好于随機猜測分類器,即誤差率小于50%
內建學習中基學習器的誤差率不能超過50%,否則組合分類器的誤差率會大于50%
個體學習器的概念
boosting bagging的概念、異同點
了解不同的結合政策(平均法,投票法,學習法)
随機森林的思想
随機森林的推廣
随機森林的優缺點
随機森林在sklearn中的參數解釋
随機森林的應用場景