「算法」深度學習中必須知道的數學知識 - 8. 神經網絡中的數學函數

如果您喜歡這篇文章或者希望及時看到系列文章的下一篇内容，請點選右上方的“關注”。感謝您的支援和鼓勵！

該系列曆史文章如下，點選連結可檢視：

「算法」深度學習中必須知道的數學知識 - 1. 概述

「算法」深度學習中必須知道的數學知識 - 2. 神經元的數學表示

「算法」深度學習中必須知道的數學知識 - 3. 激活函數神經元的工作

「算法」深度學習中必須知道的數學知識 - 4. 什麼是神經網絡

「算法」深度學習中必須知道的數學知識 - 5. 講解神經網絡的結構

「算法」深度學習中必須知道的數學知識 - 6. 翻譯為神經網絡的語言

「算法」深度學習中必須知道的數學知識 - 7. 網絡自學習的神經網絡

本節我們來看一下神經網絡世界中頻繁出現的函數。雖然它們都是基本的函數，但是對于神經網絡是不可缺少的。

一次函數

在數學函數中最基本、最重要的就是一次函數。它在神經網絡的世界裡也同樣重要。這個函數可以用下式表示。

a 稱為斜率， b 稱為截距。

當兩個變量 x、 y 滿足式 (1) 的關系時，稱變量 y 和變量 x 是一次函數關系。

一次函數的圖像如下圖的直線所示。

例1 一次函數 y = 2x + 1 的圖像如下圖所示，截距為 1，斜率為 2。

以上是一個自變量的情形。這個一次函數關系也同樣适用于多個自變量的情形。例如，有兩個變量 x1、 x2，當它們滿足下式的關系時，稱 y和 x1、 x2 是一次函數關系。

我們将會在後面講到，在神經網絡中，神經單元的權重輸入可以表示為一次函數關系。例如，神經單元有三個來自下層的輸入，其權重輸入 z 的式子如下所示。

如果把作為參數的權重 w1、 w2、 w3 與偏置 b 看作常數，那麼權重輸入 z 和 x1、 x2、 x3 是一次函數關系。另外，在神經單元的輸入 x1、 x2、 x3作為資料值确定了的情況下，權重輸入 z 和權重 w1、 w2、 w3 以及偏置 b是一次函數關系。用誤差反向傳播法推導計算式時，這些一次函數關系使得計算可以簡單地進行。

問題1：作出一次函數 y = - 2x - 1 的圖像。

解如下圖所示，截距是 - 1，斜率是 - 2。

備注自變量

有兩個變量 x 和 y，如果對每個 x 都有唯一确定的 y 與它對應，則稱 y 是 x 的函數，用 y = f (x) 表示。此時，稱 x 為自變量， y 為因變量。

二次函數

在數學函數中，二次函數與一次函數同樣重要。我們所說的代價函數使用了二次函數。二次函數由下式表示。

二次函數的圖像是把物體抛出去時物體所經過的軌迹，也就是抛物線（下圖）。這個圖像中重要的一點是， a 為正數時圖像向下凸，進而存在最小值。這個性質是後面講到的最小二乘法的基礎。

例2 二次函數 y = (x - 1)2 + 2 的圖像如下圖所示。從圖像中可以看到，當 x = 1 時，函數取得最小值 2。

以上考察了一個自變量的情形。這裡考察的性質在推廣到多個自變量的情形時也是不變的。例如，有兩個自變量 x1、 x2 時，稱下面的函數為關于 x1、 x2 的二次函數。

例3

這裡， a、 b、 c、 p、 q、 r 為常數， a ≠ 0， c ≠ 0。

對于有兩個以上的自變量的情形，就難以在紙面上畫出圖像了。例如，隻能像下圖那樣畫出式 (3) 的圖像。

實際的神經網絡需要處理更多變量的二次函數。不過，記住這裡考察的二次函數的圖像後，在了解多變量的情形時應該不難。

注：式 (3) 所示的圖像并不僅限于上圖所示的抛物面。

問題2 試作出二次函數 y = 2x^2 的圖像。

解圖像如右圖所示。

機關階躍函數

神經網絡的原型模型是用機關階躍函數作為激活函數的，它的圖像如下所示。

我們用式子來表示機關階躍函數。

從這個式子我們可以知道，機關階躍函數在原點處不連續，也就是在原點不可導。由于這個不可導的性質，機關階躍函數不能成為主要的激活函數。

問題3：在機關階躍函數 u(x) 中，求下面的值。

① u( - 1) ② u(1) ③ u(0)

解：答案依次為 0、 1、 1。

指數函數與 Sigmoid 函數

具有以下形狀的函數稱為指數函數。

常數 a 稱為指數函數的底數。 e 是一個特别重要的底數，其近似值如下。

e = 2.71828 ...

這個指數函數包含在以下的 Sigmoid 函數 σ(x) 的分母中。 Sigmoid 函數是神經網絡中具有代表性的激活函數。

注：exp 是 exponential function（指數函數）的簡略記法，exp(x) 表示指數函數 ex。

這個函數的圖像如右圖所示。可以看出，這個函數是光滑的，也就是處處可導。函數的取值在 0 和 1 之間，是以函數值可以用機率來解釋。

問題4：在 Sigmoid 函數 σ(x) 中，求以下函數值的近似值。

① σ( - 1) ② σ(0) ③ σ(1)

解：取 e = 2.7 作為近似值，答案依次為 0.27、 0.5、 0.73。

正态分布的機率密度函數

用計算機實際确定神經網絡時，必須設定權重和偏置的初始值。求初始值時，正态分布（ normal distribution）是一個有用的工具。使用服從這個分布的随機數，容易取得好的結果。

正态分布是服從以下機率密度函數 f(x) 的機率分布

其中常數 µ 稱為期望值（平均值）， σ 稱為标準差。它的圖像如下圖所示，由于形狀像教堂的鐘，是以稱為鐘形曲線。

問題5：試作出期望值 µ 為 0、标準差 σ 為 1 的正态分布的機率密度函數的圖像。

解：如下圖所示，這個正态分布稱為标準正态分布。

按照正态分布産生的随機數稱為正态分布随機數。在神經網絡的計算中，經常用到正态分布随機數作為初始值。

備注： Excel中的正态分布随機數

在 Excel 中，可以像下面這樣産生正态分布随機數。

= NORM.INV(RAND(), µ, σ) （ µ、 σ 是期望值和标準差）

「算法」深度學習中必須知道的數學知識 - 8. 神經網絡中的數學函數

繼續閱讀

2021年銀行從業考試考情介紹,果斷收藏!

證券從業合格證書什麼時候列印？有哪些注意事項？

【幹貨滿滿】初級銀行從業考試《個人理财》重點梳理

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

通俗了解查準率(precision)和查全率(recall)

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

人工智能如何有效地運用于自然語言處理

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡