裝袋
- 采取自助法抽樣抽取樣本
- 根據樣本建立一顆樹
- 循環步驟1和2 k次,得到k顆決策樹,不必剪枝
- 對分類問題,k個結果中出現類最多的那個類作為最後的分類;對回歸問題,取k個結果的均值
提升
-
對D中每個樣本初始化權值為w=1n
w
=
1
n
- for i = 1 to k do:
- 根據權重和D得到模型Mi,計算其錯誤率e=所有訓練錯誤的樣本的權重之和
- 如果Mi的錯誤率>50% –> return 步驟3
- 計算該分類器的權重:alpha = 1/2log((1-e)/e)
- 更新樣本權值:正确分類了的樣本:權重=權重*exp(-alpha);錯誤分類的樣本:權重=權重*exp(alpha)
- 将這些權重再歸一化(使得所有樣本權重之和=1)
- end for
- 最後的H(x)=sign(每個弱分類器*其對應權重之和)
随機森林
- 自助法抽樣抽取n個樣本
-
對這n個樣本,抽取m個特征(一般取m=n−−√
m
=
n
),根據樣本建立一顆樹
- 循環步驟1和2 k次,得到k顆決策樹,不必剪枝
- 對分類問題,k個結果中出現類最多的那個類作為最後的分類;對回歸問題,取k個結果的均值