機器之心對話谷歌進階研究科學家Greg S Corrado：人工智能并不會讓大公司形成壟斷

早在今年 5 月的時候，

機器之心就曾作為唯一一家國内媒體出席了于瑞士洛桑舉行的神經科學峰會 Brain Forum

。我們也在現場的報道中詳述了 Greg 關于深度學習和深度神經網絡的演講。

在實際的研究領域，Greg 的研究方向包括了生物神經科學、人工智能和可擴充的機器學習，并在行為經濟學、系統神經科學和深度學習等領域發表了諸多的論文。在此前很長一段時間，Greg 在谷歌都從事着大腦計算領域的研究；近期，他也成為了谷歌大規模深度神經網絡項目的聯合技術主管。

關于人工智能、機器學習以及無監督學習的現在和未來，Greg 和我們分享了許多有趣的觀點。

以下為采訪摘錄：

Question：你曾在瑞士的 Brain Forum 上提到過，機器學習并不是什麼黑魔法，而是一種工具。你覺得現在機器學習發展的最大瓶頸是什麼？

Greg：這項技術其實在不斷變化，機器學習需要資料樣本、資源和工具，還有計算機運算能力等多方面的支援。回顧機器學習發展的曆史會發現，由于計算機運算速度緩慢、成本過高等技術原因滞後，影響了程式運作的效率，無法滿足需求，于是機器學習的發展程序也比較緩慢，也沒有實際的産品和服務被推出來。

直到最近幾年計算機運算能力有了大幅提升，速度提升、成本下降并且應用越來越廣，這改變了整個局面。是以如今機器學習的瓶頸變成了與人相關的因素，在于人的創造力與創新能力，在于在擅長并懂得如何運用這項技術的人才。

是以我們的重心也發生了變化，在其餘所有因素和條件，諸如充足的資料、免費的工具、資源、足夠強大的計算機運算能力等等都滿足的情況下，我們需要教會和培養更多的人如何運用機器學習這個技術來将實作他們創新的構思。

Question：你覺得有哪些可以與深度學習相競争的機器學習方法？另外，在你眼中，分布式計算對于機器學習來說具體有些什麼益處？

Greg：目前，Deep Learning 是關于機器學習非常熱門的一項技術。市面上很多新産品和服務也都在使用 Deep Learning，但是這隻是一項現有的、能滿足當下需求的技術。但我認為更重要的是更多的研究人員和科學家能在更廣的次元和視野下繼續深入研究，這樣才能發現與時俱進，發現更新的技術來滿足這一領域下一階段的更多需求。

關于分布式計算的問題。因為機器學習本身是一個特别緩慢的過程，是以需要調用和運作大量的計算資源。分布式計算的重要性在于能夠為我們實作足夠快運作速度，來滿足我們在創新實驗方面的需求，測試我們的新點子，用結果告訴我們哪些想法可行，哪些不行。是以分步計算在我看來就是一個促進機器學習的助力，讓運算能力更快成本更低。

Question：去年你們的團隊推出了 Smart Reply 功能，請問目前這項功能運轉得怎樣？在哪些情況下郵件可以代替人工進行自行處理？

Greg：目前我們在智能回複方面發表了很多學術論文和研究報告。它的運作方式是根據收取的郵件，提取相關資訊識别其中的邏輯、語境，來組織語言進行回複。

目前能夠實作的功能僅限于一些不那麼正式的簡短的即時回複，比如「到時候見！」「抱歉我可能辦不到」，或者「我會盡快回複你」和「稍後聯系」這樣的簡單地短句，這是目前機器可以比較有效地處理的範圍，暫時還不能處理一些較為複雜和帶有意圖性的答複。

Question：我們知道目前人工智能和機器學習還僅限于處理一些較為局限、具體的專門領域，你認為什麼時候會出現更為強大的通用型人工智能？

Greg：這是一個有趣的問題，我認為未來的發展趨勢，還是專業的領域用專用的技術和模型解決特定的問題和任務，這樣的應用對于一個系統和技術更為高效且更有實際意義。

關于出現那種通用的技術我不是特别有信心，即便是有這樣的技術，我認為也不會比專用針對性地解決特定問題的解決方案更快更有效，而隻會更慢效率更低。

Question：你如何評價量子計算？

Greg：這是一個目前還停留在研究階段的技術，并沒有應用的實際，如果有也可能也是非常遙遠的未來才會實作。我認目前它還隻是一個驚豔的實體學科研課題，即便是應用到工程裝置上都還需要很長時間。如果有人能在有生之年研發并制造出量子計算機，這将大大提高計算效率，但是我現在隻能說，祝在這一領域的研究者們好運。

Question：能否談論下你對 Google 開源 TensorFlow 的了解？在未來人工智能和機器學習的發展上，Google 有哪些計劃？

Greg：對于人工智能，我想強調的是它不是一個具體的可以包裝銷售的産品。它實際上是一個工具，軟體工程師以及其他有創造力的人們可以使用這個工具來制造和開發新的産品和服務。而 TensorFlow 把這些 Google 正在使用的基本的工具開放給公衆使用。

未來這個領域相關的産品，Google 打算把自己開發的平台也通過雲服務共享給公衆使用，通過這種雲機器學習，其他開發者可以開發和實作自己的機器學習構想，就像我們在 Google 中研發一樣。他們可以通過 TensorFlow 使用我們提供的免費軟體和工具，也可以用雲服務運作他們自己建構的機器學習系統。

我們也會通過 API 向開發者提供一些預置好的機器學習的子系統，這樣開發者隻需要再添加幾行簡單的代碼就可以實作比如翻譯、圖檔識别等技術。這樣開發者并不需要成為機器學習的專家，就能開發自己的機器學習應用的産品。

Question：Google 是否有一些準則來確定人工智能技術會朝着你提到的這個方向發展？

Greg：這就是為什麼 Google 會主導去建立了一個名為 Partnership on AI to Benefit People & Society 的組織的原因，Partnership on AI 是一個獨立的非盈利組織，還有很多公司都參與其中促成一個關于人工智能技術如何與人類、社會、經濟等互動的話題開放式的讨論平台，促進人們對人工智能技術的了解，讨論甚至是公開辯論。更多地把關于這些話題面臨的挑戰放到桌面上來公開讨論，要好過于由各家公司私底下研究。

Question：如今很多公司在推出自己的産品和服務的時候都會标榜人工智能，但是市場營銷中提到的人工智能和深度學習是否真實可信還需要甄别和考量，如何辨識人工智能真僞?

Greg：這麼看來目前市面上确實存在一些公司把人工智能和機器學習用于品牌營銷的政策，但是最終消費者應該在意和關注的并不在于技術是如何研發的，而在于這些技術是否真正在發揮作用。如果通過使用某些産品你确實感覺到它的智能，覺得它有用，何必在意技術是如何實作的。是以我的建議就是消費者還是要從産品自身的功能這些切實能考量的标準來識别，而不要輕易被市場營銷左右，因為它根本不重要。

Question：目前存在一些對于大公司關于隐私和壟斷方面的質疑和顧慮；同時，很多小規模的公司也認為自己在競争中處于弱勢地位，無法和大公司競争，因為大公司擁有太多使用者資訊。你怎麼看這個問題?

Greg：首先談一下使用者隐私的問題，隐私對于消費者乃至每個人都很重要，是以對于公司來說，很重要的一點就是必須非常清晰明确地和使用者溝通公司的隐私政策和标準是怎樣的，使用者則可以根據這些資訊來決定是否認可并繼續使用這些産品和服務。

我剛才講到的 Partnership on AI，這個組織一個重要的功能，就是幫助制定一些原則和标準，來規範各個公司的具體操作。但最終決定權還是交回使用者和消費者自己的手中。同時一家公司如果想要使用者持續地使用自家的平台，他們就必須想辦法赢得并維護使用者的信任。

接下來講一下小公司如何成長壯大的過程，一家從事某些小研究專注小範圍的産品的公司逐漸壯大起來是一件很尋常的事情，就像當年 IBM 并沒有想方設法阻止微軟的成長，微軟也沒有阻止 Google 的成長，Google 也沒有阻止 Facebook 做大做強，這種情況會永遠持續地發生下去。從好地方面看，目前我們的行業總是能以某種方式保持更疊并不斷前行。

另外，資料量是否足夠這個問題的重要性目前其實正在削弱，資料是否足夠取決于你想要達到的目标。比如物體識别功能對于當年的還在上學的我來說就是科幻小說，但當今任何一個計算機科學專業的研究所學生都能做到，收集到相關資料來運作某個程式也是很容易的事。同理，現在任何一個科學技術類的競賽，所有參賽者能擷取的資料都是一樣的。

同樣的資料量在 1997 年或許不夠，但在 2010 年之後，資料量的差異已經不能起到多重要的作用了，更多的資料也不見得能有多大的益處。語音識别也是同樣的道理，不需要特别多的資料就能實作某個新的嘗試。及時是衆所周知奇迹般的成就 AlphaGo，它其實也是使用的公開的圍棋比賽資料和資料實作的機器學習。是以機器學習的秘訣并不在于錄入了秘密的資料，而在于人的創意和計算資源本身的創造性。

Question:與多階學習相比，使用基于多圖表征的異構資料的聯合學習的好處是什麼？

Greg：目前這一領域的研究還尚有缺口，我們希望看到更多關于機器多任務學習的研究出現，還有比如 multi-renpresentation learning（多表征學習），trasfer learning（遷移學習）其實也是機器學習研究人員研究了很長一段時間的課題。但直到最近，我們才看到一些實際的應用成果出現，這些研究領域确實讓人感到很興奮。每年我能看到一些新的觀點湧現出來，今年我也特别關注和期待這一領域的新進展（比如 ICML、ICLR 這些學術年會）。

Question：你認為 Google 在人工智能領域最大的競争對手是誰？

Greg：對于這個行業的所有公司來說，好消息每個公司都人才濟濟，同時全球很多大學以及公司都有自己的人工智能實驗室在不斷嘗試創新和研發，是以整個行業都從中受益。如果這個行業隻有一家公司獨大，那麼這個領域的發展将會更慢更低效。是以人工智能行業競争越大越開放是一件好事，并且我們希望這個大環境能繼續這麼開放且持續地充滿競争。

Question：你分别對監督學習、無監督學習和半監督學習各有什麼看法？

Greg：人工監督下的機器學習已經很好的投入實際應用，無人工監督的機器學期據我所知還沒有投入實際應用需要更多的科研努力，半人工剛好介于兩者之間。

Question：你覺得目前的深度學習有哪些急需突破的點？

Greg：這個機器學習不應當是一種我們所說的黑魔法。最重要的是需要讓人們更容易地探索，不同的配置調配（tuning）和變量（因需而異作出差異化的模型調整），他們不需要去猜想這是什麼黑魔法以及背後的工作原理，這将會是接下來 Deeplearning 的發展方向，無論是理論研究還是工程應用更新方面，更好地探索學術理論研究中的猜想名額構思和模組化。

Question：你覺得目前 multi-graph presentation（多圖表達）面臨的最大挑戰是什麼？Google 又是如何解決的？

Greg：關于多圖表達，我們現有的技術手段還停留在創新研發階段，還有很多空白領域有待研究。可以說是剛剛起步吧，是以我們也很鼓勵更多的研究人員能在這個領域積極探索。

機器之心對話谷歌進階研究科學家Greg S Corrado：人工智能并不會讓大公司形成壟斷

繼續閱讀

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

GNU科學函數庫[參考手冊][v0.1 Build 090129 Beta][GNU Scientific Library]

與專家面對面：Android開發入門問與答

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普