天天看點

阿裡研究員吳翰清:世界需要什麼樣的智能系統?不得不說的話科技的進步是為了解放生産力五年前做不出大規模的機器智能系統世界需要什麼樣的機器智能系統建構智能時代A組

作者 | 吳翰清

不得不說的話

在過去的18個月裡,我拒絕了所有的采訪,投入了全部的精力專心在做一件事情。是以我想先借着這篇文章澄清一下18個月以來網上的所有關于我的新聞、抖音視訊等,都是好事者編撰的我的段子,用來吸取流量的假新聞。這些假新聞讓我很苦惱,因為這些新聞将我描繪成為了我最不想成為的人,裡面的我是一個符号,而不是真實的我。我為此專門給今日頭條寫過信,要求稽核并過濾這類不實傳播,但隻清淨了一個月。我想再進一步隻有向監管部門回報,以及繼續保留法律追責的權利。

這些未經我許可的新聞和視訊,将我描繪成了一個無所不能的人,連帶着馬老師也受到了牽連。我想有沒有我,馬老師都睡得很安穩。阿裡的安全是上千名工程師共同努力的結果,我一個人的力量在其中的貢獻極其微薄。我也從沒有黑過阿裡的網站,隻是以前因為工作性質在授權的情況下對阿裡的業務系統做過很多的安全測試。我們不應該捧吹以破壞為目的的黑客,那是犯罪,是我最不想成為的人。我過去的工作是對抗黑客攻擊,打擊網絡犯罪,是以以破壞系統的黑客來描述曾經的我,是對我最大的羞辱。真正的黑客精神是挑戰權威,追求開放、自由,而并非入侵計算機系統。我想是時候終止這些不正确的傳播了。

至于我過去取得的一點不足為人道的成就,我想99%的讀者都沒搞明白我為什麼會在2017年被評為 MIT TR35,大家隻是在看個熱鬧,鼓鼓掌。但我不需要這樣的掌聲,我不需要大家為我個人鼓掌,我希望大家是為我的作品鼓掌。這也是為什麼在2014年以後我幾乎不再寫文章的原因。我希望大家記住的是我的作品,我對社會的貢獻,而非我個人的成長軌迹。從這個角度來看,我對自己還非常不滿意,人們關注我的經曆多過我的作品,是以我還得加倍努力。

就我個人來說,從2017年下半年開始,我離開了網絡安全領域,進入到了今天大家所說的人工智能領域。我帶領團隊在浙江,在上海,在重慶建設了很多關鍵的基礎設施系統。尤其是2018年在上海做的事情,傾注了我的所有心血,我從來沒有如此認真地做過一件事情,結果也很好。隻是這些事情并不曾對外宣傳,故不為外人所知。這18個月來關于我個人的假新聞滿天飛,讓我哭笑不得,因為這些段子手連我最引以為豪的事情都沒搞清楚。

是以我今天決定寫一篇文章,作為一名工程師,我想把我對未來的判斷寫下來,也許可以幫助一些人少走一點彎路。隻代表個人的看法,不代表公司的觀點。

科技的進步是為了解放生産力

我将生産力的進步分為五個階段:體力勞動,機械化,電氣化,資訊化,智能化。其中每一次科技的進步,都會帶來生産力的解放,對社會的改變是巨大的。

在140年前發生的第二次科技革命,讓電力深入到各行各業。自從中央發電站和交流電變壓器等關鍵技術建構的電力基礎設施成型後,擷取電力的成本逐漸降低,各種各樣的電氣應用開始湧現,人們擷取到了新的、穩定的能源。

我們現在知道電力最早是應用在電話、電報、電燈上的,也正是電氣照明這一需求,拉動了電力基礎設施的發展。因為在當時電力的用途比較單調,并沒有今天這麼琳琅滿目的電器。在100年前愛迪生通用電氣與威斯汀豪斯之間的主要競争就是聚焦在電氣照明領域。我們很難說在這個過程中,到底是電燈泡更重要,還是發電站更重要。我曾經比喻說目前雲計算面臨的窘境,就是「中央發電站」已經造出來了,我們有單叢集上萬台伺服器規模的算力基礎設施,但是「電燈泡」在哪裡卻沒有找到。我們用「中央發電站」在點「瓦斯燈」,今天托管在雲計算上的業務,大多數依然是「資訊化系統」。而理想中的會消耗大量算力的應用,應當是「智能化系統」。我們一直在苦苦追尋雲計算的「電燈泡應用」,卻求之不得。

這裡需要講清楚「資訊化系統」和「智能化系統」的差別。我認為「資訊化系統」的本質是編輯資料庫,一個業務系統如果存在大量人工互動,依賴于人送出表單來完成業務,那麼就是一個資訊化系統。而我理想中的「智能化系統」,應該是以自動完成任務為目的,以任務作為輸入,以完成的結果作為輸出,中間的過程應該是機器高度自動化完成的。以其完成任務的複雜度,來評價其智能程度的高低。

從這個角度看,「智能手機」并不智能,依然是個「資訊化系統」。市面上形形色色的智能系統也都隻是冠上了智能的名号在魚目混珠。我并不是說「資訊化系統」沒有價值,資訊化系統很有價值,但不是下個時代的東西。自從計算機技術發展以來,産生的各色各樣的資訊化系統極大地改變了世界,完成了從「電氣化」到「資訊化」轉型更新的重要一步。這就是我們看到各色各樣的計算機系統開始應用在各個領域,幫助人們更加高效的管理工作和提供服務。

網際網路在這一過程中扮演了放大作用。我認為網際網路本身并不是生産力,網際網路隻是連接配接了成千上萬個資訊化系統,進而具備了規模效應。網際網路是規模經濟,能讓一個系統的價值實作上千倍、上萬倍的放大,但是生産力是資訊化系統本身提供的。能夠接收網際網路連接配接服務的終端,是浏覽器,是 iOS 和 Android,這些端的演進本身是重要的。百度通過網際網路連接配接了人和資訊,騰訊通過網際網路連接配接人和人,阿裡通過網際網路連接配接了人和資訊化服務。但是這些都不是下一個時代的東西。

下一個時代會發生的事情,首先是出現智能化系統對資訊化系統的更新換代,然後會出現通過網際網路連接配接所有智能化系統的公司。智能化對資訊化的更新換代,是一次巨大的生産力進步,處于社會變革中的商業公司的結局是适者生存。從曆史來看,在資訊化時代的PC作業系統更新換代到移動作業系統,其過程就是天翻地覆的。蘋果的iPhone 釋出之後,所有的開發者都不再給微軟的 Windows 寫軟體,而轉去給 iOS 寫軟體,對微軟帶來了強烈的沖擊,如果不是微軟後來又抓住了雲計算的機遇,就很可能會從此一蹶不振。從商業發展的角度看類似事件一定會發生,在資訊化時代的龐然大物很可能随着一次生産力的變革就變得無足輕重。那麼現在所有的問題在于,未來世界需要的智能系統到底是什麼?

讓機器獲得智能,一直是計算機科學家孜孜以求的事情。在過去簡單的專家系統,依靠經驗和規則,也能處理簡單的任務。但有一個弊病是對于專家經驗未覆寫的異常情況,機器就不知道怎麼處理了。是以後來出現了資料驅動誕生的智能。

我們看到當機器具備一定的智能後,就能處理相對簡單的任務,進而部分地解放人的生産力,此時增加機器規模就等同于增加人力的規模。而機器智能和人的智能又各有所長,機器運算量大且不知疲倦,是以對于很多工作都有可能做到精細化管理。這往往能帶來成本的節約。

比如在過去公共汽車的排班是按照經驗,在一個線路裡設定好公共汽車的數量,但是如果市民的出行情況發生波動時,公共汽車的供需關系之間一定會存在差異,有的線路會繁忙,有的線路則會空閑,進而出現資源的浪費。要解決這一問題需要先統計清楚每輛公共汽車每一趟的精确載客人數,再依靠機器智能精細化的排程公共汽車到不同的線路,就能在同等資源下實作效率最優。是以使用機器智能的好處是顯而易見的。

五年前做不出大規模的機器智能系統

我們看到在生産力發展的過程中,從資訊化到智能化的這一轉型更新正在到來,已經到了爆發的前夜。這得益于四項技術的成熟:雲計算、大資料、IoT、網絡連接配接技術。

我們知道機器智能目前的發展是得益于對腦科學的研究,以及算力的進步,讓神經網絡進化到了深度學習,進而在視覺、語音等領域有了重大突破。算力的重要性毋庸置疑,但是光有算力依然難以在實際的應用中取得成功,還需要其他幾項技術的成熟。在目前的技術環境來說,雲計算為智能提供了足夠的算力,是算力基礎設施;大資料技術提供了資料處理的方法論和工具,是資料基礎設施(目前還沒有壟斷性的資料基礎設施,碎片化嚴重);IoT 技術将智能裝置的成本降到了足夠低,為部署豐富的神經元感覺裝置提供了基礎;網絡連接配接技術,從4G到5G,為資料的高速傳輸提供了重要基礎。

如果有科技樹這種說法的話,那麼機器智能的大規模應用,就需要先點亮前四個技術,這是基礎。在五年以前,這幾項技術的成本是制約我們将智能技術大規模應用的主要瓶頸。到今天已經逐漸成熟了。

在一項新技術剛出現的時候,我們往往會遇到兩個問題。

第一個問題是人才的稀缺性問題。我們知道一個懂深度學習或其他機器智能技術的博士生剛畢業的年薪可能比得上一個工作了十年的程式員。業界各處都需要機器智能,供不應求。

第二個問題是技術的成本問題。新技術剛出來的成本一定是昂貴的,就像雲計算剛出來的時候也是先解決能力問題,再解決效率問題。我前些時看一個報告,AWS 的 EC2 推出到現在連續降價了57次。我們熟知的摩爾定律,計算的性能每18個月翻一倍,也就意味着同等算力的硬體每18個月會降一半的成本。機器智能作為新技術也有同樣的規律,在一開始我們不要指望它的成本會足夠便宜到能進入千家萬戶,新技術的普及需要時間。隻是我們往往迫不及待。

這兩個問題決定了機器智能在一開始的時候,應該首先被應用在對社會效率撬動最大的那個點上。從商業上我們要找到這樣的場景,來讓這項技術脫離實驗室,走向社會,通過商業來源源不斷的滋養這項技術的迅速成長。

世界需要什麼樣的機器智能系統

這兩個問題随着時間的推移很快就能解決。但今天産業界真正碰到的問題我認為是搞偏了方向。這展現在兩個方面。

第一個問題是未來不應該存在一個「人工智能」的産業,我們今天的分類就分錯了。就像自電力基礎設施誕生以來,各行各業都需要用電,是以電力成為了一個關鍵生産要素。我認為未來智能也是一個關鍵生産要素,每個行業都需要,是以不需要單獨劃分一個人工智能産業。單獨搞了一個人工智能産業,反倒不知道這些公司在幹什麼了,這些公司自己也産生了困惑。最終應該像今天的零售業一樣,每個做零售的都有個電商部門,會通過網際網路來做營銷和銷售。未來每個企業也應該有一個部門,就是負責他們的智能系統的建設與訓練。要像訓練寵物一樣訓練智能系統,使他具備智能。這不是某一家人工智能公司要做的事情,而是每家公司都要自己做的事情。

第二個問題和機器智能技術的發展有關。因為最近這次機器智能的熱點是從深度學習開始,在視覺、語音等領域有了巨大突破,是以産業化後的企業往往都是在做視覺、語音、自然語言處理等工作。但是我們千萬别忘了完整的人腦智能是從「感覺」到「行動」,并通過不斷的回報完成高頻率的協同,最終誕生了智能。

隻做「感覺」是一個巨大的誤區,從技術上講沒有問題,但是從商業上講創造的社會價值就很有限了,因為其解放的生産力相對是有限的。

從生産力發展的角度來講,評判一個智能系統的社會價值,應該以它解放生産力的多少來衡量。隻做「感覺」就是隻能看,但是做了這麼多大型項目後,我發現所有的價值創造都是在于「處置」環節。是以隻做感覺,很難講清楚投入産出是否值得,但是一旦開始進入到「行動」環節,就會開始解放生産力,價值是可被量化的。這裡的行動,是機器智能實作了對人力或其他裝置的排程。

實際上從技術發展的角度看,我們早就擁有了讓機器智能做決策的能力。搜尋引擎和個性化推薦,就是典型的通過機器智能做決策。通過每天處理海量的資料,最終實作精細化的比對。

是以我認為一個完整的「智能系統」,是包含了「感覺」與「行動」,其中支撐行動的是決策和排程的技術。而衡量這個智能系統是否有價值的标準,是看其解放的生産力的多少。

遺憾的是,到今天為止我認為業界并不存在一個理想的「智能系統」。業界目前的狀态我稱之為「有智能,沒系統」。很多人工智能的創業公司擁有局部的智能能力,比如視覺、語音、NLP、知識圖譜、搜尋、推薦等中的一項或多項技術,但是很少有公司有完整的技術棧。而像 BAT 等公司具備完整的技術棧,但是卻并沒有将所有的技術整合成為「感覺」+「行動」的一個完整系統,而是各項技術以碎片化的形式存在。尤其是将所有技術應用到某一個具體場景中解決某一個具體問題的,更是寥寥無幾,而這正是催生出這一智能系統的關鍵所在。是以這是一個工程化的問題,工程化的挑戰在于整合所有智能技術,實作完整的「感覺」+「行動」能力,并有效的控制成本,實作對開發者友好的接口。

在智能技術的角度來看,「自動駕駛」和「智能音箱」是兩個完整的從「感覺」到「行動」閉環的場景。我認為這兩個場景可以用來打磨機器智能技術,但是目前在商業上比較難成功。「自動駕駛」解放了所有的駕駛員,對解放生産力的價值非常明顯,但是因為受制于今天城市的道路基礎設施,是以對老城市的意義不大。今天城市的道路不是為自動駕駛設計的,也很難容納下自動駕駛的汽車。是以自動駕駛更适合航空、航海、物流等領域,商業範圍一下小了很多。「智能音箱」綜合了多項機器智能技術,其核心技術「對話機器人」被稱為人工智能領域的聖杯,想要做好難度相當之大。但是「智能音箱」目前的階段對家庭中各種任務的生産力解放極其有限,價值很難講清楚,最後淪為玩物的可能性比較大。盡管如此,随着時間的推移,随着基礎設施的更新換代,這兩項技術也會逐漸煥發出他們的生命力。

如果用航空業來比喻的話,今天的智能技術,就好比造飛機,市面上已經有了很多零件和引擎,但是所有的廠商都拿着零件當飛機賣,客戶以為他買了一架飛機,其實隻是買了個零件(因為生産力并沒有得到多大的解放)。而今天真正的難點在于飛機設計圖紙都還沒有。

是以我打算先畫一張,造架飛機玩玩。

建構智能時代

飛機想要真正飛上天,還需要幾個東西。

首先是飛行員。飛行員不一定要懂得怎麼造飛機,造飛機是個門檻很高的活。但是飛行員要懂得怎麼開飛機,最後還要讓人人都能坐飛機。我認為飛行員就是未來各個企業裡智能部門的員工,他們負責訓練買來的智能系統,讓智能系統真正具備智能。由于各個企業擁有的資料的不同,以及「飛行員」技能的高低和責任心,最後的各個企業的智能系統的聰明程度也會出現差異。世界是豐富多彩的。

其次是航道。我認為航道依然是基礎設施提供商的,包括營運商、雲計算廠商等。

最後是機場。機場需要負責所有航班的排程和協同,為所有的飛機提供服務。這是最有意思的地方。我認為「機場」是最後真正的商業模式,就像蘋果的 AppStore一樣。

我認為在智能時代的「機場」,最重要的工作是給機器智能系統提供服務,而并非給人提供服務。

想象一下未來網際網路裡,70%-80%的人口是機器智能,他們處理了未來世界的絕大多數工作,而每一個機器智能又是有一個主人的。其主人可以是個人,也可以是組織,但都是有主權的。每一個機器智能存在的目标都是為了完成某個或多個任務。那麼為所有的機器智能提供服務,就會是一個巨大的商業模式。

機器智能系統的自動協同是通往未來的關鍵路徑

同時我也認為目前的機器智能産業,過于重視人與機器的互動,而忽視了機器與機器的互動。而後者才是更重要的事情。因為人與機器的互動依然是回到了資訊化系統的老路上去,而機器與機器的自動協同,則是在進一步将智能系統的價值實作規模放大。

是以未來有必要給所有的機器智能定義一套語言,他們之間的交流可以像人一樣擁有自己的語言,實作簡單的邏輯。而所有機器智能之間的互動與協同,是不需要人工幹預的,就像你家的孩子與鄰居家的孩子自己會去玩耍一樣,你不需要幹預到他們的交流之中,他們自己會各取所需地完成各自的任務。

以「一網通辦」的業務舉例。在目前一網通辦的主流實作辦法是将政府各委辦局的資料實作全量彙聚後,進行資料治理,并梳理流程,重塑業務。這種大資料應用的思路依然是停留在資訊化建設的老路上,其弊端是想推動新技術落地的前提是流程先改革,同時各個不同地區的高度定制化導緻很難在全國實作規模化的産品。但其實也可以有另外一種智能化的建設思路,讓每個委辦局自己建一個機器智能系統,其任務就是代替公務員處理各自的視窗業務。當市民來送出一個申請時,經過認證後,該委辦局的機器智能系統就根據所需材料,自行向其他委辦局的機器智能系統發出協同請求,經過幾輪機器智能之間的交流和協同之後,市民很快就得到了他想要的結果。這種多個機器智能系統之間自動協同的機制,對流程的沖擊明顯會小很多。

機器智能之間的互動與協同需要通過網絡連接配接到一起,但安全性是可控的,因為是業務之間的協同,而并非資料本身發生了交換。因為每一個機器智能都有自己的主人,所有的訓練過程也都發生在其主體内部,是以資料并不需要被拿出來交換共享。主人可以設定機器智能什麼能說,什麼不能說,所有的安全控制都發生在智能系統内部,而一旦連接配接到網際網路要與其他機器智能協同或使用「機場」提供的服務,就會轉為「預設不信任」模式。

至于機器智能系統到底部署在公共雲還是專有雲,這并不是一個重要的問題,主人愛部署在哪裡就部署在哪裡。是以時至今日,雲計算依然有被管道化的危險,就像營運商被網際網路内容提供商管道化一樣,未來雲計算廠商也可能會被智能廠商管道化。因為雲計算和大資料都不是智能。

A組

也是以,為了以上這些構想,我受命在阿裡雲成立「A組」。「A組」成立的使命就是為了建構出這一機器智能系統,讓智能時代更快的到來。

我認為這是一件需要整個社會共同努力三十到五十年的事情,就像在過去的三十到五十年我們在資訊化建設上付出的所有努力一樣。

以上,就是我想對世界說的話。

我說,你聽。

阿裡雲-GTS-A組 吳翰清

繼續閱讀