为什么说bagging是减少variance，而boosting是减少bias?

2023-07-21 11:01:50

Bagging中有两个操作都可以达到降低variance的效果，首先每一轮生成树的时候都是用bootstrap的方式在采样，即保证了数据集的相对多样性；此外bagging还随机选择k个特征，这可以进一步保证每个树之间的差异性，因此对于单独的一棵树来说它的偏差是非常高的，但是由于bagging生成的树可以是多种多样的，达到了防止过拟合的作用，即降低了方差。而对于bias来说的话，由于基分类器优化的目标本质上是一致的，所以bagging前后的bias是差不多的。

Boosting，每一轮迭代都根据前面迭代模型的效果来进行修正，进行样本或分类器的加权。这个过程也可以理解为一步一步的逼近真实值。因此如果迭代次数足够多，可以产生更好的预测结果，也就是减少了偏差。同时由于boosting中的基分类器是强相关的，总是利用残差来进行计算，所以不能显著的降低variance。

为什么说bagging是减少variance，而boosting是减少bias?

继续阅读

集成学习 (AdaBoost、Bagging、随机森林 ) python 预测

快速理解bootstrap,bagging,boosting-三个概念

coursera机器学习技法笔记(7-8)——blending and bagging & Adaptive Boosting

【集成学习】scikit-learn随机森林调参小结 1. scikit-learn随机森林类库概述 2. RF框架参数 3. RF决策树参数 4.RF调参实例

关于智能IVR系统的一些思考

监督学习 | 集成学习之Bagging、随机森林及Sklearn实现集成学习1. 投票分类器2. Bagging & Pasting3. 随机森林参考资料

bagging和随机森林的原理和区别

【ML笔记】梯度提升决策树（GBDT）和随机森林（RF）的异同

第二章.互联网情景下的智能学习——bias VS variance & 欠拟合过拟合的概念

Delegate（委托）中的Covariance（协变）和Contravariance（逆变）

机器学习中的bias和variance、欠拟合和过拟合

机器学习笔记第4课：偏差，方差和权衡

集成学习 - Bagging

Python 数据分析实例——Boosting算法

提升方法学习(AdaBoost、GBDT与XGBoost)一、提升方法的基本思路二、AdaBoost算法三、提升树算法四、梯度提升算法(GBDT)五、XGBoost算法六、总结七、参考文献

AdaBoost算法详解及示例分析