楊強教授PPT通俗易懂解密：如何在人工智能浪潮中少走彎路

近兩年人工智能技術的研究與應用驟然增速，産業界，無論是身經百戰的科技巨頭，抑或是默默無聞的中小企業，都想要抓住這一難得的機遇，在業内嶄露頭角。但是，如何将人工智能與自身原始的商業模式相結合，實作産業創新，很多企業都還在“摸着石頭過河”，難免遇到迷茫期。

在2016年GAIR大會上，楊強教授深入淺出地為大家分享了自己多年來的智慧與經驗總結——人工智能要取得成功應當具備的五個必要條件，這五個條件将成為推動人工智能長足發展的動力源泉。

楊強，香港科技大學計算機與工程系教授,IEEE Fellow，IAPR Fellow,AAAS Fellow和ACM傑出科學家。，第四範式首席科學家、機器學習領域國際學術帶頭人，主要研究領域為機器學習、資料挖掘和自動規劃。到目前為止，楊教授在學術研究中碩果累累，在人工智能和資料挖掘方面，已發表了超過了200篇的學術文章，還組織籌辦了多個人工智能和資料挖掘的國際會議。

當下人工智能在圖像識别、語音識别和大規模的産品推薦方面取得了巨大的成功，那麼人工智能的成功應用究竟取決于哪些條件？

為什麼隻在我們這個時代迎來了人工智能發展的高峰期？對于這兩個備受關注的問題，楊教授從人工智能的科學與應用兩個方面着手，娓娓道來。

人工智能的科學與應用——相輔相成

人工智能技術的發展大體可以分為兩個方面：人工智能的科學與人工智能的應用。

從科學層面談及人工智能要回歸到該研究領域最根本的問題：機器能夠思維嗎？這個問題最早起源于人工智能之父圖靈，之後經過60多年的努力，計算機科學家及各行各業對人工智能感興趣的人士都競相研發計算能力更強的計算機，彙聚更多的資料，提出更進階的算法，緻力于回答這個最基本、也是最重要的問題。

談到應用層面，除去人工智能已經為我們的生活帶來的便利，我們更關心它對人類未來生活将産生什麼樣的影響。要将人工智能技術成功地應用于商業領域，既要站在科學前沿，也要具備一定的商業頭腦，兩者兼備才能在商業浪潮中立于不敗之地。

人工智能取得成功的五個必要條件

會上，楊教授言簡意赅為我們分享了決定人工智能成功的五個必要條件：

清晰的目标（商業模式）

高品質的大資料（持續回報）

清晰的問題定義和領域邊界

懂人工智能的跨界人才（擅長應用和算法）

計算能力

首先，要有“清晰的目标”，即清晰的商業模式，這就好比遊戲中明确規定何為赢，何為輸，延伸到人工智能在商業領域的應用，即要确定明确的運作模式和運作目的。

其次，高品質的大資料資源是人工智能成功的核心條件。楊教授特别強調，高品質的資料要求收集到的資料能夠具備持續性、回報性，且回報的方式與内容要與具體的算法相比對。有人會覺得，在某個領域擁有了幾千萬個資料樣本便具備從事人工智能的條件了，楊教授認為，這種觀點是站不住腳的，原因如下：首先，已收集的資料樣本可能無法與某個特定的算法相比對；其次，所用到的算法可能不具備可持續性；最後，得到的回報方式與内容不一定與期望相符。

第三，清晰的問題定義和領域邊界。要求在應用人工智能技術時要對所遇到的問題有清晰的了解與定義，就像下棋一樣，在有限定的領域裡完成特定的行為操作。

第四，人工智能成功的核心競争力在于懂人工智能的跨界人才（擅長應用和算法），即我們需要一個既精通人工智能，又在商界遊刃有餘的人才。當然，很多人會質疑：我們到哪裡去找這樣的人才？楊教授号召我們做生活中的有心人，善于關注身邊會學習的人，着重培養其跨領域才能，這樣的人才将具備把兩個看似不同的垂直領域聯系在一起的能力，在未來能夠做出突出的成就。

最後，楊教授提出，強大的計算能力是人工智能技術在各領域成功應用的硬實力。在計算能力方面，我們有雲計算、并行計算、GPU，這都為人工智能的發展奠定了堅實的基礎。

人工智能已經取得的成就——強化學習與遷移學習

此外，楊教授提到，人工智能已經在機器學習領域已經取得了突出的成就，特别是在深度學習方面，此外，還特别強調了強化學習與遷移學習的應用前景。

強化學習

楊教授講到，強化學習的優點在于它不僅能夠學習人的行為，而且能夠更好地使用延遲回報功能。以Google DeepMind采用的強化學習流程為例，我們可以将這個流程圖了解為一個計算機内部的表達形式，一個矢量，這個矢量與我們得到的回報資訊相結合，将有助于改進我們采用的政策。流程圖中的政策，簡單來講，就是我們平常的行為規劃，工作規劃，就好比遊戲中的一個動作就對應一個政策，這個政策再傳回來，産生一個新的界面，如此我們便能夠進行持續學習。在這個循環過程中，我們隻有到最後才能夠獲得回報，稱之為延遲的回報。就好比我們投資一隻股票，過了很長時間才知道收益如何。

但是，這個循環暴露出強化學習的一個局限性：人們永遠無法準确定義這個政策裡的空間，我們稱之為“狀态空間”，即強化學習的結果具有不可預測性。說到這裡，楊教授以Google DeepMind的第二個目标——端到端的深度學習為例。當該有的狀态預先在學習器内表達好後，就形成了一種從輸入端到輸出端的端到端的深度學習模型，經過幾百次的訓練學習後，機器将能夠學會如何更好地玩一個遊戲。

以下各個圖對應不同遊戲的學習效果。圖中橫軸表示随着遊戲輪數越來越多，機器的自學習效果不斷提升，直至達到上限。

遷移學習

遷移學習是深度學習與強化學習的結合體，能夠将适用于大資料的模型遷移到小資料上，實作個性化遷移，這樣一來能夠避免資料寡頭的出現。

楊教授提出一點：

大資料設計出來的模型用于小資料上，它的副産品就是個性化。這就是遷移學習的目的。

運用遷移學習把在一個資料領域已經建立的非常好的模型，應用到另一個領域，這樣既節省了資源，又能夠節省時間，效果又好。

楊教授談到，我們人很自然就具備這種舉一反三的遷移能力，比如我們學會騎自行車後，學騎機車就很簡單了；會打羽毛球，再學打網球也就沒那麼難了。

在演講中，楊教授總結了遷移學習的四種實作方式，每一種方式都很直覺。

第一種為樣本遷移，就是在資料集（源領域）中找到與目标領域相似的資料，把這個資料放大多倍，與目标領域的資料進行比對。樣本遷移的特點是：1）需要對不同例子權重；2）需要用資料進行訓練。

第二種為特征遷移，就是通過觀察源領域圖像與目标域圖像之間的共同特征，然後利用觀察所得的共同特征在不同層級的特征間進行自動遷移。

第三種為模型遷移，其原理時利用上千萬的圖象訓練一個圖象識别的系統，當我們遇到一個新的圖象領域，就不用再去找幾千萬個圖象來訓練了，可以原來的圖像識别系統遷移到新的領域，是以在新的領域隻用幾萬張圖檔同樣能夠擷取相同的效果。模型遷移的一個好處是我們可以區分，就是可以和深度學習結合起來，我們可以區分不同層次可遷移的度，相似度比較高的那些層次他們被遷移的可能性就大一些。

第四種為關系遷移，比如社會網絡，社交網絡之間的遷移。

遷移學習的最終目的就是實作AI for Everyone。比如我們利用一個由訓練三萬個的對話模式獲得的大對話模型可以遷移到個人的小型對話中，這種基于強化學習所擷取的個性化效果非常具有實用性，因為我們不用繁瑣地問使用者很多同樣的問題。此外，楊教授在會上曾提到一個願景——利用遷移學習，即使是自身沒有條件獲得大量訓練資料的小公司也可以按照自己的需要應用大公司訓練出來的模型，進而普及AI的應用，進而克服資料“寡頭”現象。不論怎樣，遷移學習是一種極具潛力的解決方案，将在未來大顯身手。

運用“魔鏡對話系統”執行個體闡釋人工智能成功的五個必要條件

此外，楊教授用一個人工智能技術應用的熱點——對話系統，清晰地闡明上述五個條件對人工智能技術發展所産生的推動性作用。

現有對話系統的應用原理

一般來講，市場上現有的對話系統可以分為兩類：閑聊類與功能類。

在上圖中，我們可以看到：60年代的Eliza與微軟的小冰屬于閑聊類對話系統，百度的小度與微軟的Cortana介乎閑聊類與功能類之間，Facebook的M與HKUST最新的Magic Mirror系統屬于功能類對話系統。楊教授講到，我們大家應該都有體驗，微軟小冰很幽默，但是也隻能止于閑聊；功能類對話系統則給我們的生活帶來了很多便利，例如，我們打電話到酒店預定房間，在銀行辦理個人業務，不過，在一定程度上，目前的功能類對話系統依然存在一些不太便利的地方，例如，在使用過程中，我們要根據系統提醒依次按服務鍵，這可能導緻使用者體驗下降。

從技術層面上進行分析，楊教授提到對話系統可以大緻分為兩種：基于原則的系統與基于學習的系統。最早的對話系統是基于原則的，有很多專家來制定這些規則，其優點在于準确性高，但是卻難以擴充，與資料無關，對資料的靈敏度不高。此外，基于原則的對話系統的由于無法擴充，通常情況下不能應對不同的意外事件，是以現在大家關注較多的是基于機器學習算法研發的對話系統。

三層結構算法模型将為對話系統帶來革新

楊教授透露說，香港科技大學實驗室正在研究如何運用新技術來改進現有的對話系統。在大會上，楊教授向我們展示了一個三明治式的三層結構算法模型：

第一層是我們熟知的深度學習神經網絡——遞歸深度神經網絡（RNN）

第二層是一個政策學習器——強化學習（RL）

第三層是遷移學習（TL）

在演講中，楊教授特别強調了強化學習（RL）中最難的階段：人工智能機器人隻能部分觀察周圍的世界，研究者用一個奇怪的名字來描述這種現象——基于部分觀察的馬爾可夫決策過程。遷移學習（TL），正如在前面講到的，能夠将一個已經做好的模型遷移應用到一個新的領域中。楊教授講到，希望利用這樣一個三層結構賦予對話系統以下功能，比如說閑聊、推薦、引導、提醒、學習，如果一個對話系統能夠具備這些功能，它就像一個真人一樣。

但是，如何達到這個目的呢？

根據楊教授的觀點，首先，對話系統應當具備基本的對話功能，即自然語言生成能力，這種能力主要依賴RNN來實作。

其次，我們需要一個政策，用這個政策引導對話的對象來完成一個特定的任務，即對話控制，主要通過RL實作。

最後，要實作個性化，滿足使用者不同的需求指令，主要依靠TL實作。

為此，楊教授給我們提供了一個執行個體，香港科技大學現在和一個O2O的公司合作，用真是的資料訓練這個對話系統，上圖中綠色代表使用者所提的問題，白色代表系統的回答，該系統的中文名字叫做“魔鏡系統”，就是童話故事白雪公主裡面的魔鏡，當然這是一個好的魔鏡。“魔鏡系統”是個性化學習的一個執行個體。

在這個系統中，我們是把整個對話系統放置在一個機器人裡面，讓機器人通過語音的方式與使用者對答，實際上，這個系統可以在手機上與人進行交流。楊教授的研究團隊将“魔鏡系統”與大家熟悉的一些對話系統作對比，下圖中，綠色代表使用者的問題，黃色是小冰的回答，可以看到相比之下，小冰的回答多富有調侃性，準确度很低，而之前“魔鏡系統”的回答更容易滿足使用者的需求。此外，我們還可以看到siri（灰色）的回答很多都是“抱歉沒有找到比對”，因為siri是基于搜尋的對話系統。

楊教授表示，他們之是以對這種對話系統進行研究，歸根到底是對背後的系統感興趣，即我們在剛開始講到的——人工智能成功的五個必備條件。在對該對話系統背後的原理進行剖析，可以發現，其研究團隊具有很明确的目标，有很好的回報，有不斷到來的資料，有跨界人才，此外，和O2O公司有聯絡。

談及清晰的問題定義與領域邊界這個必要條件，楊教授表示，我們不一定像在下圍棋一樣，要确定明确的邊界，在這裡我們可以考慮說當我們現在的談話進行到這裡時，到底離我們的目标還有多遠，這就好像在下棋裡面一樣，我們對目前的盤面有一個估算，同時我們可以接着往下問不同的問題，就像我們下面要下的棋子一樣，是以對話系統的問題定義與領域邊界問題實質上與Alphago的思維很相像。

楊教授講到，同深度學習、強化學習及遷移學習一樣，這個三層結構算法模型也具有通用性。比如楊教授的學生就把這種模型應用到大家公認的很難的領域中——預測股市走勢。下圖所示為A股裡面的某個股票，用過去十年的資料訓練該模型。首先，運用資料之間的連接配接，産生不同的狀态，讓各個狀态之間能夠互相遷移。其次，不同狀态之間将發生變化，我們運用用一個強化學習器模拟這種變化。最後。我們發現深度學習的隐含層裡面會自動産生幾百個狀态，基本就能夠對這十年來的經濟狀況做出一個很完善的總結。是以，運用這種三層結構算法模型可以很好地對股市走勢作出預測，對此，我們也做了一些相關測試。

楊教授表示，這個例子隻是在金融領域的一個小小的試驗。不過，一旦我們對一個領域有了透徹的了解，并掌握更多的高品質資料，就可以将人工智能技術遷移到這個領域來，在應用過程中對所遇到的問題作清晰的定義，最終能夠實作通用型人工智能的目的。

總結

在演講接近尾聲時，楊教授對所講的内容做出總結：通過同大家分享谷歌DeepMind的應用執行個體，講解強化遷移學習和三層結構算法模型，及個性化學習，最終我們都要回歸到人工智能成功的五個必要條件——清晰的商業模式（明确的目标）、高品質的大資料、清晰的問題定義和領域邊界、懂人工智能的跨界人才及計算能力，這五個條件互相影響，缺一不可，是人工智能技術長足發展的動力機。

本文出處：暢享網

本文來自雲栖社群合作夥伴暢享網，了解相關資訊可以關注vsharing.com網站。

楊強教授PPT通俗易懂解密：如何在人工智能浪潮中少走彎路

繼續閱讀

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

9.spark Core 進階2--Cashe

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

淺談企業活動中進行資料分析的重要性

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

hdu7108哈希