如何在Chatbot中應用深度學習？

編者按：本書節選自圖書《深度學習算法實踐》，本書以一位軟體工程師在工作中遇到的問題為主線，闡述了如何從軟體工程思維向算法思維轉變、如何将任務分解成算法問題，并結合程式員在工作中經常面臨的産品需求，詳細闡述了應該怎樣從算法的角度看待、分解需求，并結合經典的任務對深度學習算法做了清晰的分析。

公開課福利： CSDN學院邀請到本書作者吳岸城，他将分享的主題為「深度學習中基礎模型性能的思考和優化」。報名連結：http://edu.csdn.net/huiyiCourse/detail/536

人類其實從很早以前就開始追求人類和機器之間的對話，早先科學家研發的機器在和人對話時都是采用規則性的回複，比如人提問後，計算機從資料庫中找出相關的答案來回複。這種規則性的一對一比對有很多限制。機器隻知道問什麼答什麼，卻不知道舉一反三，比如你問它：“今天天氣怎麼樣？”它會機械地把今天的天氣告訴你。這不像人與人之間的對話，人是有各種反應的，這類反應的産生是基于人的知識結構和對話場景的。

那麼，你覺得這類機器是否真的具有智能了？圖靈測試是這樣判斷機器人是否具有智能的：測試中，一個正常人将嘗試通過一連串的問答，把被試的機器與人類區分開來。一般來說，如果正常人無法分辨和自己聊天的是人還是機器人的時候，機器人就算通過測試了。

圖靈測試的關鍵之處在于，沒有定義“思維/意識”。隻是将機器人作為黑盒，觀察輸入和輸出是否達标。是以說它從一開始就繞開了“機器能思考嗎？”這樣的問題，而是把它替換成另外一個更具操作性的問題——“機器能做我們這些思考者所做的事嗎？”。大家注意這兩者其實完全不是一個層次的問題。

然而，“機器能思考嗎？”和“機器能做我們這些思考者所做的事嗎？”這兩個問題真的可以互相替代嗎？

比如說，機器能夠寫詩，甚至比許多資質平庸的人寫出的詩更像樣子。如果我們人為拟定一套标準，來為機器和人寫的詩打分，那麼完全有可能設計出一台能夠赢過絕大多數詩人的寫詩機器。但這真的和人類了解并欣賞一首詩是一回事嗎？再比如，人工智能在國際象棋、圍棋領域已經比人類更強大，但這真正和人類思考如何下棋是一樣的嗎？

世界上有這麼一個關于圖靈測試的獎項——“勒布納獎”，頒給擅長模仿人類真實對話場景的機器人。然而，這個獎項大多數的獲得者都沒有看上去那樣智能。比如一個人問一台機器“你有多愛我？”，如果它想通過圖靈測試，它就不停地顧左右而言他，比如回答“你覺得呢？”事實上大多數問題都可以用反問去替代，說白了這些僅僅是一些對話技巧。而獲勝者并沒有真正了解“你有多愛我？”這樣的問題。

這裡有句話，希望大家記住：人工智能的真實使命是塑造智能，而非去刻意打造為了通過某類随機測試的“專業”程式。

所幸到今天為止，很多學者都意識到了圖靈測試的局限性，如果我們要發明人工智能，就要真正清楚地定義人工智能。同樣如果我們要做智能對話，我們也要清晰地定義智能對話。

在2013年的一次國際會議上，來自多倫多大學的計算機科學家發表了一篇論文，對“圖靈測試”提出了批評。他認為類似這樣的人機博弈其實并不能真正反映機器的智能水準。對于人工智能來說，真正構成挑戰的是這樣的問題：

鎮上的議員們拒絕給憤怒的遊行者提供遊行許可——“因為他們擔心會發生暴力行為”——是誰在擔心暴力行為？

A．鎮上的議員們

B．憤怒的遊行者

類似這樣的問題，機器有沒有可能找到正确的答案？要判斷“他”究竟指代誰，需要的不是文法書或者百科辭典，而是常識。人工智能如何能夠了解一個人會在什麼情況下“擔心”？這些問題涉及人類語言和社會交往的本質，以及對話的前後語境。這些本質其實是一種規則，而這種規則是在不停變化的。正是在這些方面，目前人工智能還無法與人類相比。

這意味着，制造一台能與人類下棋的機器人很容易，但想要制造一台能了解人類語言的機器人卻很難。

為了更好地了解機器對話，英特将現有的對話技術進行總結并畫出流程圖（見圖3-1），這裡面涉及的邏輯和子產品較多，英特是從模拟人類對話的第一步，即了解人類的語言開始的，當然要做到完全了解人類的語言在目前來講也不太可能。對于機器人來說，無論何種用途的機器人，首要需要解決的就是了解人類說了些什麼，而除了指令句式以外，了解人類說什麼就是了解人類提出的各種問題。請移步下一節來看看如何了解人類的提問。