天天看點

《白話深度學習與TensorFlow》——2.4 深度學習應用

我們在第1章所介紹過的谷歌無人駕駛汽車僅僅是深度學習的一個典型應用,深度學習的應用領域越來越多,而且是幾乎在任何一個産業中都有其落地的身影。我們先來看幾個有趣的應用。

2.4.1 圍棋機器人——AlphaGo

擊敗李世石的谷歌AlphaGo就不用說了,它已經進入我們的視線很久了。

它由谷歌旗下DeepMind公司的戴維·西爾弗(David Silver)、艾佳·黃和戴密斯·哈薩比斯(Demis Hassabis)與他們的團隊開發,這個程式利用價值網絡(value network)去計算局面,用政策網絡(policy network)去選擇下子。2015年10月AlphaGo以5∶0完勝歐洲圍棋冠軍、職業二段選手樊麾;2016年3月對戰世界圍棋冠軍、職業九段選手李世石,并以4∶1的總比分獲勝。2016年7月18日,世界職業圍棋排名網站GoRatings公布最新世界排名,AlphaGo以3612分,超越3608分的柯潔成為新的世界第一。

AlphaGo其實是有兩個“大腦”組成的,也就是兩套完整的深度學習網絡來進行配合計算的。

第一大腦:落子選擇器(move picker)。

AlphaGo的第一個神經網絡大腦是“監督學習的政策網絡”,觀察棋盤布局企圖找到最佳的下一步。事實上,它所基于的理論仍舊是周遊一棵樹。它預測每一個符合規則的下一步的最佳機率,或者說是每一步落子後獲勝的機率,然後選擇其中一個獲勝機率最高的位置落子。這可以了解成落子選擇器。

《白話深度學習與TensorFlow》——2.4 深度學習應用

第二大腦:棋局評估器(position evaluator)。

AlphaGo的第二個大腦棋局評估器是在做另外一件事情。它可以用來評價一個盤面的好壞程度,是以這種所謂的棋局評估器就是價值網絡,通過整體局面判斷來輔助落子選擇器。這個判斷僅僅是個大概的價值評估,但對于盤面的閱讀速度提高很有幫助。通過分析潛在的未來局面的“好”與“壞”,AlphaGo能夠決定是否通過特殊變種去深入閱讀,也就是多看幾步棋。如果棋局評估器說這個特殊盤面的變種不行,那麼AI就跳過閱讀在這一條線上的任何更多落子,進而加快盤面閱讀的速度。

《白話深度學習與TensorFlow》——2.4 深度學習應用

在這個圍棋軟體的背後可以說是凝聚了大量的深度學習工程師的心血的,不過也可以說是凝聚了全世界所有圍棋高手和圍棋愛好者的心血。AlphaGo變得這麼強悍,不是因為它天生有這麼強的功能,而是因為它在不斷和世界上所有的圍棋高手以及圍棋愛好者下棋的過程中不斷進行學習和自我完善——它每天可以完成100萬盤棋,甚至是讓自己的“左手”跟自己的“右手”下棋,并從中總結規律。這是任何人類都無法做到的。

2.4.2 被教壞的少女——Tai.ai

同樣是在2016年3月,微軟在測試一款新型聊天機器人Tay.ai,不過悲劇的是這款機器人在Twitter上經過使用者的不正當“調教”已經變成了“女流氓”,不僅飙髒話,還發表一些帶有種族歧視的言論,最後微軟不得不将其下線。

據悉,這款聊天機器人主要是定位于18~24歲的美國年輕網友,微軟對機器人的交流内容并沒有做任何設定,通過和網友進行對話學習,來逐漸形成自己的交流體系。使用者隻需在Twitter上@TayandYou就能得到Tay.ai的回複。

《白話深度學習與TensorFlow》——2.4 深度學習應用

使用者對Tay.ai似乎很感興趣,不過出乎意料的是,在24小時之内,Tay.ai就開始被網友帶壞,釋出了不少攻擊性的言論,讓人大跌眼鏡,不少網友見證了Tay.ai從腼腆少女到不良少女的轉變。有人還畫了一種一臉邪念的漫畫來把這個“女機器人”的表現具象化。目前微軟方面表示正在對這款人工智能機器人Tay.ai進行調整。

從原理分類來說,Tay.ai所基于的技術應該是RNN及其擴充領域,也就是循環神經網絡recurrent neural networks,這種技術能夠比較容易識别上下文關系并對其進行深度學習。但是同樣是那個問題,計算機自己是極難識别“善惡美醜”的,這種對于人的三觀會有較清晰劃定的東西對于計算機來說确實很難。

一方面人類對抽象事物的了解本身就有優勢,對于與自己三觀有沖突的東西本身就有天然的抵觸性,但是計算機沒有——它沒有判斷這種是非的能力。

另一方面,計算機學習的速度真的是快得驚人。要不怎麼說一切事物都有兩面性呢,即使是學壞它也比一般人學壞得快。髒話我們人一分鐘學十句,人家一分鐘學個十萬句估計跟玩一樣。是以最後實在沒辦法,微軟隻能把它下架了。

不過你也不用想太多,雖說是把機器人教壞了,也隻是看上去有點壞,它的内心還是“清白”的,它自己其實根本隻是在模仿人類說話,根據上下文找一句看上去“最該說的”話,但它其實并不知道自己在真的說什麼。

2.4.3 本田公司的大寶貝——ASIMO

《白話深度學習與TensorFlow》——2.4 深度學習應用

應該說阿西莫是目前世界上為數不多的可以以類人型出現的綜合場景應用的機器人。阿西莫的身高為130cm,寬45cm,進深34cm,最大行進速度為每小時9km——可别小看,人家是可以雙腳離地進行奔跑的9km啊。可以連續行走40min不用充電。

《白話深度學習與TensorFlow》——2.4 深度學習應用

它背後的匣子就是電池,比我們平時用的手機電池大多了,不過也沒辦法,這麼複雜的機器人不耗電才奇怪。

它的頭部、腕部、手部、腰部、腳部有很多的自由關節,整個肢體合計可以有57個自由度的彎曲次元,感觸極為細膩,是以他所能做的事情也是非常令人歎為觀止的。

《白話深度學習與TensorFlow》——2.4 深度學習應用

它可以打斷一個人的談話,并告知這個人有飲料送過來了。

《白話深度學習與TensorFlow》——2.4 深度學習應用

它可以根據人的行走方向做預判,并調整自己的行進方向不要與對方發生碰撞。

《白話深度學習與TensorFlow》——2.4 深度學習應用

即便是三個人同時說話它也能聽清楚三個人分别講述的内容并加以複述。

你以為光這樣就完了嗎?那可太低估人家了。

《白話深度學習與TensorFlow》——2.4 深度學習應用

阿西莫還可以用恰當的力道把水杯蓋子打開,向紙杯裡倒水,你說這得多溫柔。

《白話深度學習與TensorFlow》——2.4 深度學習應用
《白話深度學習與TensorFlow》——2.4 深度學習應用

還有就是類似踢球和上下樓這種對平衡性要求極為苛刻的事情,阿西莫也能輕松勝任。怎麼樣,是不是确實很厲害?

對于阿西莫的訓練來說,深度學習的技術肯定是少不了了。不過除此之外更厲害的恐怕還是本田公司的各種硬體感覺器技術、材料工程技術(包括電池、超導等)、自動化技術等綜合領域的結合和應用。阿西莫基本代表了當今世界人形機器人制造的最高水準,目前能夠做到與這個水準類似的機器人制造團隊還是寥寥無幾。給筆者印象最深的還是美國的Boston Dynamics公司的Atlas系列機器人,雖然樣子沒有阿西莫那麼萌吧,但是也能夠雙腳行走,而且在濕滑的地面上走也不會摔倒。被人故意推倒也能站起來,還能夠負重走路保持平衡,也是讓人眼前一亮。

《白話深度學習與TensorFlow》——2.4 深度學習應用

人形機器人的制造是對綜合學科的應用的考驗,能夠進行制造和普及才能夠彰顯科技大國的真正實力,筆者本人也是非常期望中國能夠早點出現能夠與阿西莫媲美的人形機器人。

繼續閱讀