[人工智能-深度学习-16]：神经网络基础 - 模型训练超参数 - 学习率（learning rate）

2021-11-10 04:46:05

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_csdn博客

本文网址：javascript:void(0)/article/details/120590079

第1章学习率在机器学习模型中的位置

第2章什么是超参数

2.1 超参数的定义

2.2 超参数的特性：

2.3 常见的超参数

第3章什么是学习率

3.1 学习率的作用

3.2 什么是学习率

第4章学习率对模型训练的影响

4.1 学习率的作用

4.2 学习率:分类方法1：静态与动态

4.3 学习率分类方法2：动态变化的方式

[人工智能-深度学习-16]：神经网络基础 - 模型训练超参数 - 学习率（learning rate）

学习率在上述模型中，属于3-3模型训练的一部分，是模型训练中的超参数。

超参数是相对于神经网络模型中网络模型参数w, b而言的。

超参数本身不是神经网络的构成部分，但他们是训练神经网络时，由程序员可控的、可调整的模型训练的参数。

在机器学习的上下文中，超参数是在开始学习过程之前设置值的参数，而不是通过训练得到的参数数据。通常情况下，需要对超参数进行优化，给学习机选择一组最优超参数，以提高学习的性能和效果。如学习率就是一个超参数。

定义关于模型的更高层次的概念，如复杂性或学习能力。

不能直接从标准模型培训过程中的数据中学习，需要预先定义。

可以通过设置不同的值，训练不同的模型和选择更好的测试值来决定

树的数量或树的深度

矩阵分解中潜在因素的数量

学习率（多种模式）

深层神经网络隐藏层数

k均值聚类中的簇数

梯度下降法的迭代步长，主要取决于函数在某一点处的导数。

（1）函数在任意一点的导数（梯度），是由函数本身确定的，无法修改，为了能够调整迭代的步长，这就需要引入了新的参数控制迭代的步长。

（2）另一方面，函数的导数，有可能非常大，如果直接使用原始的梯度（导数）作为迭代的步长，这个步长可能非常大，到大是迭代无法收敛，这就需要引入了新的参数控制迭代的步长。

基于上述的两个原因，引入了学习率。

运用梯度下降算法进行优化时，权重的更新规则中，在梯度项前会乘以一个系数，这个系数就叫学习速率α。

学习率的作用是控制迭代的步长。

（1）静态学习率：学习率有程序员设定初始值，在训练的过程中不需要修改。

（2）动态学习率：在训练模型的过程中，根据上下文动态修改学习率

（3）自适应学习率：在训练模型的过程中，根据w, b的参数动态调整学习率

[人工智能-深度学习-16]：神经网络基础 - 模型训练超参数 - 学习率（learning rate）

继续阅读

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

吴恩达机器学习笔记（3）

吴恩达j机器学习之过拟合

吴恩达机器学习(一) 介绍

深度学习模型分析人类复杂疾病的准确性

疾病研究：重症肌无力

人工智能如何有效地运用于自然语言处理

新闻 | Mapbox 牵手阿里，飞猪旅行上线六大城市地图功能

【趋高机器视觉】机器视觉技术原理解析及解决方案

吴恩达 coursera ML 第七课总结+作业答案前言目录正文模型表示作业答案

[HTML5]自定义属性 data-* 和 jQuery.data 详解

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告

cs231n斯坦福基于卷积神经网络的CV学习笔记（一）KNN和线性分类器/分类器损失/反向传播一，KNN图像分类算法二，线性分类器三，线性分类器损失四，反向传播五，神经网络

2021年危险化学品经营单位安全管理人员考试题库及危险化学品经营单位安全管理人员考试技巧

无人机--飞控科普