adaboost算法_adaboost算法原理學習筆記

2023-07-02 09:18:40

adaboost算法是boosting系列算法的一種，boosting系列算法是串行生成多個弱學習器，并根據結合政策得到強學習器。Adaboost算法能用于分類和回歸，本文隻介紹分類算法。

上篇文章講到了boosting系列的算法思想，adaboost算法是它的具體實作。

boosting系列算法都需要解決下面幾個問題：

1)如何計算學習誤差率e

2)如何得到弱學習器的系數α

3)每次疊代過程中，如何更新樣本權重D

4)采用何種結合政策

本文介紹的adaboosting算法回答了上述的4個問題。

1. Adaboosting算法步驟

假設訓練集樣本為：

adaboost算法_adaboost算法原理學習筆記

第k輪疊代的資料集樣本權重為：

adaboost算法_adaboost算法原理學習筆記

初始化樣本權重為：

adaboost算法_adaboost算法原理學習筆記

下面基于boosting系列算法的4個基本問題來介紹Adaboost算法

1) 學習率誤差的計算

adaboost算法_adaboost算法原理學習筆記

其中

adaboost算法_adaboost算法原理學習筆記

為第k輪弱學習器的輸出。

2)如何得到弱學習器的系數α

adaboost算法_adaboost算法原理學習筆記

表示第k輪疊代的弱學習器的系數。

3)如何更新樣本權重D

adaboost算法_adaboost算法原理學習筆記

表示第k輪疊代過程中，第i個樣本的權重。

4)采用何種結合政策

Adaboost算法采用權重平均的方法，并通過sign函數得到最終的分類結果：

adaboost算法_adaboost算法原理學習筆記

2. Adaboost算法的幾個知識要點

Adaboost算法一系列弱學習器的權重平均，暫不考慮sign函數(因為不影響算法的思想)，有：

adaboost算法_adaboost算法原理學習筆記

由上式可知，Adaboost算法是一種加法模型。

令

adaboost算法_adaboost算法原理學習筆記

表示為第k輪疊代後的強學習器，由加法模型可得：

adaboost算法_adaboost算法原理學習筆記

Adaboost算法的損失函數為指數函數，即：

adaboost算法_adaboost算法原理學習筆記

根據本節介紹的這幾個知識點，可反推出樣本權重的更新公式和弱學習器的權重系數，具體請參考https://www.cnblogs.com/pinard/p/6133937.html。

Adaboost的優點在于簡單，且模型不易過拟合。缺點是若資料集包含了異常樣本，則異常樣本在疊代過程中會獲得較高的權重，導緻模型分類性能較差。

歡迎掃碼關注：

adaboost算法_adaboost算法原理學習筆記

adaboost算法_adaboost算法原理學習筆記

繼續閱讀

boosting算法_boosting

adaboost算法_AdaBoost算法的原理與實作

adaboost算法MATLAB實作！李航統計學習例子matlab實作！前言一、例子二、算法實作結果

Python實作Adaboost

adaboost算法_adaboost為什麼要增加基分類器？

連載｜如何通俗了解AdaBoostAdaBoost

adaboost算法_第八章提升方法（第2節 AdaBoost算法的訓練誤差分析）

sgp4模型具體算法_【機器學習基礎】數學推導+純Python實作機器學習算法28：CRF條件随機場...

sgp4模型具體算法_金融風控系列之四：內建算法和決策樹

bagging算法_Boosting和Bagging: 如何開發一個魯棒的機器學習算法導讀BootstrappingBaggingBoosting總結

內建學習之boosting算法的基本原理

AdaBoost算法概述基本原理算法步驟損失函數正則化主要優點主要缺點

【機器學習sklearn】內建學習（Ensemble Learning）1. 內建學習基本内容2. Boosting算法3. Bagging與随機森林4. 結合政策5. sklearn實踐參考文獻

AdaBoost算法的推導以及誤差分析

Adaboost 算法的原理與推導（筆記）

AdaBoost數學原理