偏差/方差（bias/variance）

優化完成後，你發現網絡的表現不盡如人意，這時診斷網絡處于高偏差/高方差狀态是對你下一步調參方向的重要指導。與經典機器學習算法有所不同，因為深度神經網絡通常要處理非常高維的特征，是以網絡可能同時處于高偏差/高方差的狀态，即在特征空間的一些區域網絡處于高偏差，而在另一些區域處于高方差。本節，我們對偏差/方差作一簡要介紹。

偏差

偏差度量了網絡的訓練集誤差和貝葉斯誤差（即能達到的最優誤差）的差距。高偏差的網絡有很高的訓練集誤差，說明網絡對資料中隐含的一般規律還沒有學好。當網絡處于高偏差時，通常有以下幾種解決方案。1. 訓練更大的網絡。網絡越大，對資料潛在規律的拟合能力越強。2. 更多的訓練輪數。通常訓練時間越久，對訓練集的拟合能力越強。3. 改變網絡結構。不同的網絡結構對訓練集的拟合能力有所不同。

方差

方差度量了網絡的驗證集誤差和訓練集誤差的差距。高方差的網絡學習能力太強，把訓練集中自身獨有的一些特點也當作一般規律學得，使網絡不能很好的泛化（generalize）到驗證集。當網絡處于高方差時，通常有以下幾種解決方案。1. 更多的資料。這是對高方差問題最行之有效的解決方案。2. 正則化。3. 改變網絡結構。不同的網絡結構對方差也會有影響。

機器學習基礎--偏差和方差偏差/方差（bias/variance）

解決方案

正則化是解決高方差問題的重要方案之一。本節，我們将對常用正則化方法做一介紹。

正則化的基本思想是使網絡的有效大小變小。網絡變小之後，網絡的拟合能力随之降低，這會使網絡不容易過拟合到訓練集。

機器學習基礎--偏差和方差偏差/方差（bias/variance）

偏差/方差（bias/variance）

偏差

方差

解決方案

繼續閱讀

泛化能力、方差、偏差、過拟合、欠拟合（2）泛化能力、方差、偏差、過拟合、欠拟合

GAN及其改進算法

MachineLearning學習——0219——深度學習之多層感覺機多層感覺機Multilayer Perceptron

資訊量，熵,聯合熵，互資訊，條件熵,相對熵（KL散度），交叉熵（cross entropy）

統計學習方法學習筆記（第七章　支援向量機）

PCA 主成分分析的執行個體程式

機器學習概述----機器學習并沒有那麼深奧，它很有趣(3)

軟間隔SVM---松弛變量&懲罰因子軟間隔SVM

提升方法AdaBoost算法

簡單易懂的線性回歸基礎和從極大似然估計推導最小二乘法首先假設有這樣一組資料

決策樹Decision Tree決策樹Reference

強化學習（reforcement learning）之Deep Q-network(DQN)算法簡介

深度學習第五章機器學習基礎前半部分

機器學習數學基礎（一）：機器學習與數學分析機器學習機器學習與數學分析

高斯過程 Gaussian Process一、什麼是高斯過程二、高斯分布三、從高斯分布到高斯過程四、高斯過程回歸五、參考