天天看點

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

本文聯合編譯:blake、高斐

雷鋒網注:geoffrey everest hinton(傑弗裡·埃弗裡斯特·辛頓 )是一位英國出生的計算機學家和心理學家,以其在神經網絡方面的貢獻聞名。辛頓是反向傳播算法和對比散度算法的發明人之一,也是深度學習的積極推動者,目前任職于多倫多大學與google。作為人工智能領域的三位創始者之一,早在30年前,辛頓就已經在深度學習領域留下了自己的烙印。然而,直到計算機的性能達到深度學習的要求,辛頓才開始在學術界以外得到自己應得的廣泛認可,本文是他對于深度學習介紹的演講ppt。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

深度學習

geoffrey hinton

多倫多大學&google

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

機器學習任務的頻譜

典型的統計學方法                         

低次元資料(例如,低于1000個次元)      

資料中存在大量的噪音                        

資料不存在健全的結構, 一個極簡模型如何表示資料結構

主要問題在于區分真正結構與資料噪音         

人工智能(ai)

高次元資料(例如,多于1000個次元)

如果合理處理噪音,噪音不足以模糊資料的内在結構。

資料中有龐大得結構,資料結構過于複雜,難以用一個簡單的模型表示。

主要問題在于弄清楚如何表示複雜的資料結構,使得這種結構易于學習

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

深度學習簡要發展史

用于學習多層非線性特征的反向傳播算法于20世紀70年代和80年代被提出來并得到多次發展演變(werbos, amari, parker, lecun, rumelhart et al)。

當時,反向傳播算法具有廣闊的應用前景,然而,到20世紀90年代,機器學習領域的衆多研究者開始停止運用該算法,原因如下:

—該算法不能有效利用多數隐藏層(除了其在“時延”和卷積網的應用)。 —該算法不能在遞歸網絡中發揮有效作用。
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

如何學習多層特征(~1985)

運用反向傳播錯誤信号以獲得用于學習的衍生工具:

首先輸入輸入資訊向量,通過隐藏層,最終得到輸出結果,對比輸出結果與正确答案得到錯誤信号。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

随機梯度下降

計算少量随機“小批量”訓練資料的所有權重值的梯度矢量。

—這将對所有訓練資料的梯度矢量進行随機評估。 —若權重值完全出現錯誤,即便獲得一個耗費多,精确地估計值也是無意義的。

略微減小梯度估計值,以更新所有權重值。

—與其他更好地方法相比,這種原始的優化方法能夠在大資料集中發揮更好的作用。
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

反向傳播算法到底是哪裡出錯了?——20世紀90年代的觀點

反向傳播算法需要大量的标記過的訓練資料

—  幾乎所有的資料都是未經标記的。

反向傳播算法未能規劃好學習時間

—  在存在衆多隐藏層的網絡中,該算法學習速度非常慢。

在局部優化過程中,反向傳播算法會出現卡殼現象

—  該算法通常能夠得到極好的運用,但是從來沒有極好的理論。
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

運用無監督學習方式,克服反向傳播算法的局限性

保持運用梯度方法的有效性與簡潔性,以調整權重值,同時運用這種方法為感官輸入資訊建構結構。

—  調整權重,保證一個生成模型生成感官輸入資訊的最大可能性。 —  學習圖像,而非标記過的圖像。       如果你想要從事計算機視覺領域的研究,首選學習計算機制圖法。

我們應當學習哪種生成模型?

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

随機二進制機關(一種奇數選擇方法)

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

受限玻爾茲曼機

限制層與層之間的連接配接性,使學習變得更為簡單。

—隻有一層随機二進制隐藏單元。 —隐藏層之間無連接配接。

在受限玻爾茲曼機中,鑒于可視狀态,隐藏層之間存在有條件互相獨立關系。

— 當存在一個既定的資料矢量,我們能夠快速從後驗分布中擷取一個無偏差樣本。
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

受限玻爾茲曼機最大可能性學習算法圖

由可視單元的一個訓練矢量v開頭。 在更新所有平行隐藏單元與更新所有平行的可視單元之間轉換。
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

快速學習受限玻爾茲曼機的方法

由可視單元的一個訓練矢量開頭 更新所有平行的隐藏單元 更新所有平行的可視單元,以實作重構 再次更新隐藏單元
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

旁白

通過對運用兩種不同方法獲得的預測值取平均數,netflix 能夠預測出你對一部電影的喜愛程度。

其中的一種方法使用經過快速近似學習算法的一種算法版本訓練的受限玻爾茲曼機。

      這是受限玻爾茲曼機的首次重大應用。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

訓練深度網絡(受限玻爾茲曼機飽受歡迎的主要原因在于的到蓋茨比基金的支援)

首先訓練直接從像素中擷取輸入資訊的特征層。

接着,将這些講過訓練的特征視為像素,激活這些特征,在第二隐藏層學習這些特征的特征。

      如此便生成一個多層生成模型。

每當我們添加一個特征層,便能夠得到訓練資料的對數機率一個更好的可變下限,這一點可以得到證明。

      這一證明過程是非常複雜的(但是對于學術界同仁之間互相尊重極為重要)。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

精細調整,以實作區分這一目的

預訓練:首先,一次隻學習一個特征層,不使用标記過的資訊。

精細調增:增添最後一個标記單元層,反向計算标記單元的誤差,以便精細調整那些在無監督前期訓練階段學會的特征。

這種精細調整方法能夠克服标準反向傳播算法的兩個主要局限性。

      因為未經标記資料而發現好的特征,我們要求使用更少的标記。

      由于在預訓練過程中,一次僅訓練一層,并且是從可感覺的特征進行精細調整的,學習速度變得越來越快。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

為預訓練深層神經網建構聲學模型

在使用雙手機模型的标準後期處理之後,獲得23.0%的手機錯誤率。

timit之前獲得最優結果為24.4%,這便要求對幾個模型的結果取平均值。

通過較短時間的前期處理,現在我們在這一塊兒能夠做的更好。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

接下來會發生什麼

當預訓練深層神經網絡的性能優于在msr演講組一緻推崇的高斯混合模型,ibm與google對這類深層神經網絡實行進一步發展。

直至2012年,安卓系統的聲音搜尋功能便是運用一個基于深層神經網絡的聲學模型。

現在所有起到上司作用的團隊均使用神經網絡,這一技術正在向性能越來越好的遞歸神經網絡發展。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

圖像網的ilsvrc-2012競争

擁有120萬高分辨率訓練圖像的資料集。

1000種不同類别的物體。

任務是在前5次猜測中猜出“正确”的。

在這個資料集中,對現有的一些計算機視覺方法進行測試。

2012年的計算機視覺系統使用運用手工工程的複雜的多層系統。

       早期階段主要通過優化一些參數得到調整。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

ilsvrc-2012競争的錯誤率

2015年深層卷積神經網                                                     5%

多倫多大學(krizhevsky等,2012)                               16%

東京大學                                                                         26%

牛津大學(zisserman 等)                                                  27%

inria(法國國家科學院)與xrce(歐洲施樂研究中心)      27%

阿姆斯特丹大學                                                               29%

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

針對imagenet的神經網絡

alex krizhevsky等在nips 2012開發了一個非常深的卷積神經網絡(le cunn 1987),它的架構包括:

l  7個隐藏層(不包括最大池化層) l  早期的層級是卷積的 l  最後兩層是全局相連的

激活函數是每個隐層的修正線性單元

這些訓練速度快得多,且比邏輯單元要更具表現力

全局連接配接層擁有最多的參數

      dropout用來防止這些層級過拟合

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

在測試集上的樣本(以及神經網絡猜測結果)

獵豹(豹 雪豹 埃及貓) 高速列車(小轎車 地鐵 電車) 放大鏡(剪刀、放大鏡、煎鍋、聽診器)
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

修正線性單元

使用邏輯彎曲而非線性神經進行修正

y = max(0,x)

這種非線性使得深度網絡更易訓練,在處理真實值的時候也表現的更好。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

dropout:平均多個大型神經網絡的有效方式

設想一個包括一個隐層的神經網絡

每次提出一個訓練樣本時,随機以0.5的可能性省略一個隐藏單元

是以我們随機從2^h不同的架構中取樣

所有的架構權重相同
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

dropout作為一種模型平均形式

我們從2^h模型取樣。隻有一部分模型層級訓練過,且它們隻訓練過一個樣本。

權重共享意味着它們中每個模型都是十分正則化的

這比試着将權重保持在較少狀态更能實作好的正則化
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

在測試的時候我們做些什麼?

我們能對許多不同的架構進行取樣,然後在它們的輸出分布中取幾何平均數。

能用上所有的隐藏單元更好,但是要将它們的輸入權重減半

 這恰好計算了所有2^h模型預測的幾何平均數

在有更多的隐層的情況下,測試時期将權重減半是唯一一種模型平均的近似值,但是它得到結果不錯

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

1986年提出的方向傳播算法哪裡錯了?

關于它為什麼失敗,我們得出的結論都錯了。真正的原因是:

1. 我們的标記資料集太小了。(幾千倍的差異) 2. 我們的運算能力太慢了。(百萬倍的差異) 3. 我們進行權重初始化的方式錯了。 4. 我們使用了錯誤的非線性類别。

幾年前,jeff dean認為如果計算能力足夠的話,神經網絡也許能夠做到一些非常了不起的事情。

他建立許多架構讓一些大型神經網絡在google的資料中心核心區塊上進行訓練。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

卷積神經網絡(部分複雜細節已略去)

有關卷積網絡最好的類型可以去檢視hochreiter和schmidhuber于1997年釋出文章的細節。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

卷積神經網絡

卷積神經網絡十分強大,因為它們結合了兩種特性。

l  分布式隐層允許它們有效存儲之前的資訊 l  非線性動态允許它們以複雜的方式更新隐層 l  深度越深,性能更好
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

機器翻譯的一種全新方式(suskever, vinyals和le,2014)

針對每種語言,我們都有一個深度編碼器rnn和一個深度解碼器rnn

針對原始語言的編碼器rnn按照語句中文本順序進行閱讀

它最終的隐層表示的就是語句所要表達的含義。
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

針對翻譯分布的一個解碼器rnn

首先它輸出的是可能的首個單詞的機率分布

我們在這個分布中選取一個單詞,然後将它回報到rnn中最為一個輸入

給定首個單詞,rnn指定第二個單詞的分布

繼續進行,直到選完

      在訓練期間,我們隻需要輸入“正确”的單詞。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

編碼器和解碼器網絡是如何訓練的

給定一個句型組,使用反向傳播來最大化産生特定翻譯的對數可能性

目前這個系統隻訓練過一組語言

該系統已實作在該資料上的最佳水準 該系統大約需要一年來開發

如果我們使用更多的資料,并且同時對多種語言共同進行訓練編碼器和解碼器的話,它的表現會好的多

歐洲的議會給出了25種方式,我們可以通過所有的25中解碼器進行反向傳播。
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

結合視覺和語言(vinyals等近期工作的簡單介紹)

在imagent上訓練的深度卷積網絡種最後一個隐層的活動向量是能編碼圖檔中内容的“認知”

将認知規劃到深度卷積神經網絡的初始隐層

訓練rnn來輸出它在圖檔中看到了什麼

使用一個擁有20萬張圖檔(每張圖檔有幾個注釋)的資料集 不再重複訓練卷積神經網絡
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

一群人在一個戶外市場購物

(人們蜷縮圍繞着一家開放市場)

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

一個抱着填充動物玩具的孩子特寫

(一個小女孩睡在沙發上,抱着一個玩具熊)

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

文本處理的意義

一旦我們能将一句話轉化成一個思想向量,那麼一篇文本也能變成一系列的思想向量。

在接下裡的幾年裡,人們将使用深度rnns來學習對思想向量序列進行模組化。

這将捕獲自然推理過程 它應該能讓我們了解文本要表達的含義

我們可能需要數十億的神經元以及百億級的參數才能實作人類的了解水準。

深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

經典ai的意義

對于實體學家來說光波必須通過以太來進行傳播

他們認為沒有其他的可能性

對于ai研究學者來說人們必須使用正式的推理規則來通過一個一個論點來傳播含義

神經網絡内部的編碼器與解碼器沒有符号專門用來針對機器翻譯

唯一的符号是輸入和輸出

也許處理符号串不是通過操作内部符号串來實作的

處理像素陣列絕對不是通過操作内部像素來實作的
深度學習鼻祖Geoffrey Hinton幫你入門帶你飛

深度學習是從哪裡來的?

所有的主要思想和幾乎全部的實踐成果都是來源于基于興趣的研究。(gatsby基金十分重要)

目标在于鼓勵翻譯研究的政府資助也對發展深度學習科學技術有小部分貢獻

公司擅長于開發新的想法理念 長遠來看,好的想法理念卻是真正的瓶頸 是以給予大學基礎結構來發展真正的想法理念

本文作者:李尊

繼續閱讀