机器学习调参基本思想

文章目录

机器学习调参基本思想

一、泛化误差
二、调参顺序表
三、偏差 VS 方差

♦ 偏差、方差概念

机器学习调参基本思想

正确的调参思路:模型调参，第一步是要找准目标：我们要做什么？一般来说，这个目标是提升某个模型评估指标，比如对于随机森林来说，我们想要提升的是模型在未知数据上的准确率（由score或oob_score_来衡量）。找准了这个目标，我们就需要思考：模型在未知数据上的准确率受什么因素影响？在机器学

习中，我们用来衡量模型在未知数据上的准确率的指标，叫做泛化误差（Genelization error）。

一、泛化误差

当模型在未知数据（测试集或者袋外数据）上表现糟糕时，我们说模型的泛化程度不够，泛化误差大，模型的效果不好。泛化误差受到模型的结构（复杂度）影响。看下面这张图，它准确地描绘了泛化误差与模型复杂度的关系，当模型太复杂，模型就会过拟合，泛化能力就不够，所以泛化误差大。当模型太简单，模型就会欠拟合，拟合能力就不够，所以误差也会大。只有当模型的复杂度刚刚好的才能够达到泛化误差最小的目标。

那模型的复杂度与我们的参数有什么关系呢？对树模型来说，树越茂盛，深度越深，枝叶越多，模型就越复杂。所以

树模型是天生位于图的右上角的模型

，

随机森林是以树模型为基础

，所以

随机森林也是天生复杂度高的模型

。随机森林的参数，都是向着一个目标去：减少模型的复杂度，把模型往图像的左边移动，防止过拟合。当然了，调参没有绝对，也有天生处于图像左边的随机森林，所以调参之前，我们要先判断，模型现在究竟处于图像的哪一边。

泛化误差的背后其实是“偏差-方差困境”，原理十分复杂。我们需要记住这四点：

1） 模型太复杂或者太简单，都会让泛化误差高，我们追求的是位于中间的平衡点
2） 模型太复杂就会过拟合，模型太简单就会欠拟合
3） 对树模型和树的集成模型来说，树的深度越深，枝叶越多，模型越复杂
4） 树模型和树的集成模型的目标，都是减少模型复杂度，把模型往图像的左边移动

返回顶部

二、调参顺序表

那具体每个参数，都如何影响我们的复杂度和模型呢？我们一直以来调参，都是在学习曲线上轮流找最优值，盼望能够将准确率修正到一个比较高的水平。然而我们现在了解了随机森林的调参方向：降低复杂度，我们就可以将那些对复杂度影响巨大的参数挑选出来，研究他们的单调性，然后专注调整那些能最大限度让复杂度降低的参数。对于那些不单调的参数，或者反而会让复杂度升高的参数，我们就视情况使用，大多时候甚至可以退避。在我们调参的时候，大家可以参考这个顺序表：

参数	对模型在未知数据上的评估性能的影响	影响程度
n_estimators	提升至平稳，n_estimators↑，不影响单个模型的复杂度	⭐⭐⭐⭐
max_depth	有增有减，默认最大深度，即最高复杂度，向复杂度降低的方向调参max_depth↓，模型更简单，且向图像的左边移动	⭐⭐⭐
min_samples_leaf	有增有减，默认最小限制1，即最高复杂度，向复杂度降低的方向调参min_samples_leaf↑，模型更简单，且向图像的左边移动	⭐⭐
min_samples_split	有增有减，默认最小限制2，即最高复杂度，向复杂度降低的方向调参min_samples_split↑，模型更简单，且向图像的左边移动	⭐⭐
max_features	有增有减，默认auto，是特征总数的开平方，位于中间复杂度，既可以向复杂度升高的方向，也可以向复杂度降低的方向调参：max_features↓，模型更简单，图像左移；max_features↑，模型更复杂，图像右移；max_features是唯一的，既能够让模型更简单，也能够让模型更复杂的参数，所以在调整这个参数的时候，需要考虑我们调参的方向	⭐
criterion	有增有减，一般使用gini系数	看具体情况

返回顶部

三、偏差 VS 方差

一个集成模型(f)在未知数据集(D)上的

泛化误差E(f;D)

，由

方差(var)

，

偏差(bais)

和

噪声(ε)

共同决定。

♦ 偏差、方差概念

偏差：模型的

预测值

与

真实值

之间的差异，即每一个红点到蓝线的距离。在集成算法中，每个基评估器都会有自己的偏差，

集成评估器的偏差是所有基评估器偏差的均值

。模型越精确，偏差越低。

方差：反映的是模型

每一次输出结果

与模型

预测值的平均水平

之间的误差，即每一个红点到红色虚线的距离，

衡量模型的稳定性。模型越稳定，方差越低。

观察下面的图像，每个点就是集成算法中的一个基评估器产生的预测值。红色虚线代表着这些预测值的均值，蓝色的线代表着数据本来的面貌。

其中偏差衡量模型是否预测得准确，偏差越小，模型越“准”；而方差衡量模型每次预测的结果是否接近，即是说方差越小，模型越“稳”；噪声是机器学习无法干涉的部分，为了让世界美好一点，我们就不去研究了。一个好的模型，要对大多数未知数据都预测得”准“又”稳“。即是说，当偏差和方差都很低的时候，模型的泛化误差就小，在未知数据上的准确率就高。

偏差大	偏差小
方差大	模型不适合这个数据;换模型	过拟合;模型很复杂;对某些数据集预测很准确对某些数据集预测很糟糕
方差小	欠拟合;模型相对简单;预测很稳定但对所有的数据预测都不太准确	泛化误差小，我们的目标

通常来说，

方差和偏差有一个很大，泛化误差都会很大

。然而，方差和偏差是此消彼长的，不可能同时达到最小值。这个要怎么理解呢？来看看下面这张图:

从图上可以看出，模型复杂度大的时候，

方差高

，

偏差低

。偏差低，就是要求模型要预测得“准”。模型就会更努力去学习更多信息，会具体于训练数据，这会导致，模型在一部分数据上表现很好，在另一部分数据上表现却很糟糕。模型泛化性差，在不同数据上表现不稳定，所以方差就大。而要尽量学习训练集，模型的建立必然更多细节，复杂程度必然上升。所以，复杂度高，方差高，总泛化误差高。

相对的，复杂度低的时候，

方差低

，

偏差高

。方差低，要求模型预测得“稳”，泛化性更强，那对于模型来说，它就不需要对数据进行一个太深的学习，只需要建立一个比较简单，判定比较宽泛的模型就可以了。结果就是，模型无法在某一类或者某一组数据上达成很高的准确度，所以偏差就会大。所以，复杂度低，偏差高，总泛化误差高。

机器学习调参基本思想

文章目录

机器学习调参基本思想

一、泛化误差

二、调参顺序表

三、偏差 VS 方差

♦ 偏差、方差概念

继续阅读

XGBoost Plotting API以及GBDT组合特征实践 XGBoost Plotting API以及GBDT组合特征实践

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

YAML简介和PyYAML安全操作YAML支持的类型YAML的优点：yaml的基本语法python操作

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告

Small tricks

libsvm for python 安装

学习软件测试基础测试第七天

Zeppelin 配置访问 REST APIApache Zeppelin Configuration REST API

【Torch】最简洁logging使用指南

27. Remove Element(列表)题目代码

Cloud Studio初体验

使用 ctypes 进行 Python 和 C 的混合编程

【python】【数据处理】画多维数据分布图

【python】netconf协议对接管理设备

「Python 网络自动化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 网络设备

在python中创建excel并写入