神经网络-反向传播算法

反向传播算法（Backpropagation Algorithm，简称BP算法）是深度学习的重要思想基础，对于初学者来说也是必须要掌握的基础知识！本文希望以一个清晰的脉络和详细的说明，来让读者彻底明白BP算法的原理和计算过程。

本文主要介绍BP算法的原理（即公式的推导），介绍完原理之后，我们会将一些具体的数据带入一个简单的三层神经网络中，去完整的体验一遍BP算法的计算过程。

1.BP算法的推导

神经网络-反向传播算法

图1 一个简单的三层神经网络

图1所示是一个简单的三层（两个隐藏层，一个输出层）神经网络结构，假设我们使用这个神经网络来解决二分类问题，我们给这个网络一个输入样本，通过前向运算得到输出。输出值的值域为(0,1)，例如输出的值越接近0，代表该样本是“0”类的可能性越大，反之是“1”类的可能性大。

1.1前向传播的计算

为了便于理解后续的内容，我们需要先搞清楚前向传播的计算过程，以图1所示的内容为例：

输入的样本为：

神经网络-反向传播算法

第一层网络的参数为：

神经网络-反向传播算法

第二层网络的参数为：

神经网络-反向传播算法

第三层网络的参数为：

神经网络-反向传播算法

1.1.1第一层隐藏层的计算

神经网络-反向传播算法

图2 计算第一层隐藏层

神经网络-反向传播算法

1.1.2第二层隐藏层的计算

神经网络-反向传播算法

图3 计算第二层隐藏层

第二层隐藏层有两个神经元：

神经网络-反向传播算法

和

神经网络-反向传播算法

。该层的输入为：

神经网络-反向传播算法

即第二层的输入是第一层的输出乘以第二层的权重，再加上第二层的偏置。因此得到

神经网络-反向传播算法

和

神经网络-反向传播算法

的输入分别为：

神经网络-反向传播算法

该层的输出分别为：

神经网络-反向传播算法

和

神经网络-反向传播算法

1.1.3输出层的计算

神经网络-反向传播算法

图4 计算输出层

输出层只有一个神经元：

神经网络-反向传播算法

，该层的输入为：

神经网络-反向传播算法

所以：

神经网络-反向传播算法

单纯的公式推导看起来有些枯燥，下面我们将实际的数据带入图1所示的神经网络中，完整的计算一遍。

2.图解BP算法

神经网络-反向传播算法

图5 图解BP算法

我们依然使用如图5所示的简单的神经网络，其中所有参数的初始值如下：

输入的样本为（假设其真实类标为“1”）：

神经网络-反向传播算法

第一层网络的参数为：

神经网络-反向传播算法

第二层网络的参数为：

神经网络-反向传播算法

第三层网络的参数为：

神经网络-反向传播算法

其实，对该损失函数求导就会得到残差，这个残差就正好是前面所说的误差项。

2.1前向传播

我们首先初始化神经网络的参数，计算第一层神经元：

神经网络-反向传播算法

=1*0.997510281884102 + 3*0.999874045072167 + 2

= 5.9971324171006

神经网络-反向传播算法

2.2误差反向传播

神经网络-反向传播算法

接着计算第二层隐藏层的误差项，根据误差项的计算公式有：

神经网络-反向传播算法

最后是计算第一层隐藏层的误差项：

神经网络-反向传播算法

2.3更新参数

上一小节中我们已经计算出了每一层的误差项，现在我们要利用每一层的误差项和梯度来更新每一层的参数，权重W和偏置b的更新公式如下：

神经网络-反向传播算法

通常权重W的更新会加上一个正则化项来避免过拟合，这里为了简化计算，我们省去了正则化项。上式中的是学习率，我们设其值为0.1。参数更新的计算相对简单，每一层的计算方式都相同，因此本文仅演示第一层隐藏层的参数更新：

神经网络-反向传播算法

3.小结

至此，我们已经完整介绍了BP算法的原理，并使用具体的数值做了计算

神经网络-反向传播算法

继续阅读

分类算法的评价指标

K-近邻算法以及图像分类应用

weka之NB算法

使用weka的select attribute

weka中分类器算法

在weka中集成自己的算法

【多变量线性回归】学习记录序思路实现终

申请评分模型拒绝推断（RI）方法申请评分模型拒绝推断（RI）方法

通俗理解查准率(precision)和查全率(recall)

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

人工智能如何有效地运用于自然语言处理

【趋高机器视觉】机器视觉技术原理解析及解决方案

吴恩达 coursera ML 第七课总结+作业答案前言目录正文模型表示作业答案

XGBoost Plotting API以及GBDT组合特征实践 XGBoost Plotting API以及GBDT组合特征实践

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告