回溯到兩年多以前,在“我是歌手”的舞台上,阿裡的AR開啟了走出阿裡巴巴集團、走向産業化的道路。同時随之而來的是一個問題——阿裡的智能究竟該怎麼做?大家可能已經從螢幕上看到了答案,那就是兩個字——大腦。
從城市大腦、工業大腦、環境大腦、航空大腦,到剛剛胡總裁示範的農業大腦,智能之夢已經從鋼筋水泥的超大型城市走向了遙遠的邊區、走到了農村的土地上。在夢中,每一寸土地的價值都能使用數字化手段進行量化。在這個數字化和智能化的過程中,阿裡起到的作用不僅僅是幫助使用者上雲,更重要的是幫助使用者了解上雲之後應該幹什麼,在雲上發生了什麼。如果客戶的資料僅僅是在雲上存儲,那麼這離智能化還遠遠不夠。今天将帶領大家來透視一下“大腦究竟是如何煉成的”。

在各個大腦的背後,必然有很多的工程師在默默地工作着,他們都秉承着一個理念——知行合一。阿裡的目标不僅僅是讓每一個企業主、每一個工程師、每一個養殖專家做到知行合一,更希望讓城市裡的每一個信号燈、每一個地鐵售票機也做到知行合一。中國有句古話:亡羊補牢,未為晚矣。但是在高度節奏化、碎片化的現代化社會,亡羊補牢所帶來的後果是大家所不能接受的,我們更需要在亡羊之前就進行補牢,因為任何的等待都需要消耗時間成本和未來的機會成本,任何一個滞後的響應都可能對企業造成不可挽回的損失。
在剛剛的閃電立方的介紹中,分享人示範了一個pb級别的資料如何快速地上雲,在上雲之後,如何由大腦進行承接,使其做到知行合一。但是在知行合一的背後,有一個共性始終貫穿于三個産業線之中,這個共性就是資料産品。假設客戶擁有着一個pb級别的資料,包含了所有相關生産資料,如果這些資料僅僅是被記錄下來作為事故發生後的追查材料,那麼這些資料包含的價值并沒有得到真正地釋放。資料蘊含的真正價值極其龐大,正如下圖中所說的那樣,資料将是驅動智能未來的新能源。
在曆史的長河中,古羅馬擁有衆多城市,堪稱世界之都,但是随着時間的流逝,現在它留給我們的隻剩下無窮的念想,其價值沒有經受住曆史傳承的考驗,因為它沒有将資料傳承下來。到了18世紀初,Bernoulli家族意識到了這個問題,其中的一位傑出數學家更是大膽地進行預判,未來的社會必然會被海量的資料所淹沒,并提出了一個著名的定理——大數定理。今天人們所說的大資料,在某種程度上都源自于這個公式。到了1948年,Shannon基于前人的研究建立了資訊論,并提出了熵的概念。然後在1973年,日本的一位著名的統計學家Akaike提出了AIC資訊準則,建立了用于從海量的資料中提取最有價值資訊的模型,如果沒有這個模型,我們現在将被pb、tb級别的資料所淹沒。
在處理pb、tb等進階别的實時資料時,如何将數學理論和雲計算能力相結合,創造無以計算的價值,是一個難以解決的問題。首先肯定不能像“小作坊”一樣的去尋找資料,而是需要建立一條現代化的生産線,因為僅憑手工作坊是無法修建出通向未來之路的。在各個大腦的背後,有一套面向主體的資料作業系統,用于對資料進行處理。人們常說,資料是一種新能源。事實上也确實如此,資料實際上是一種高度可再生的資源,它不像撒哈拉沙漠中的石油,用一點少一點,資料每天都在産生,其價值瞬時即逝,是以資料是一種高度可再生的、價值及其稀薄的資源。是以想要從資料中提取價值,需要無與倫比的計算能力和計算方法。
資料增殖反應堆就是為了解決上述問題而提出來的。提到反應堆,人們首先想到的是核電站的反應堆,其輸入是原材料,最後的輸出是電力。同樣的道理,資料增殖反應堆也能夠提升資料的價值密度和價值效率。因為有産品,使用者可以深度挖掘資料的價值,出現了隔代遺傳和代代相傳的現象;因為有産品,挖掘使用、線上調用的速度得到了極大提升,最終使得資料的價值密度增殖十倍,價值效率提升一百倍。
資料平台的核心能力展現在以下幾個方面。一、它是全球首例城市五維實時資料融合;二、城市資料治理成熟七度模型;三、六大知識領域圖譜;四、運作時做到零髒資料。
在這個平台上阿裡提出了資料DNA的概念。當公共資料被看做為一個生命體時,其彼此間的邏輯結構便可以被看做是化學連結。如果在上層的應用出現異常,平台能夠精準的追溯到出問題的資料源。目前已經實作了資料資源平台的響應時間小于1s,無論是城市大腦、農業大腦,還是工業生産線的大腦,當上層應用出現異常時,平台會在1s内精準鎖定出問題的資料源和其所處的層次。
在今天,資料資源平台被部署到了企業的廠房和城市大腦,已經實作了标準化、集約化和規模化。是以,工程師們再也不用在高溫機房内一邊揮灑汗水,一邊編寫代碼,而隻用簡單的在平台上進行點選操作。
下圖的城市數字規劃平台是和中國城市資料規劃研究院聯合研究推出的。從之前的“軟”的角度進行規劃,到現在“軟硬兼施”地指揮城市的每一個城區的規劃、疊代和生長。城市規劃的方案再也不是靠經驗堆出來的,而是靠平台計算得到的。每一寸土地的使用、每一層高樓的搭建對周邊的影響都可以經由平台計算和量化立即得到,而不需要等到使用、搭建完成之後再進行測量。
如果将一棟建築進行拆解,它會被拆分成鋼筋水泥等元素,但是透過其表面對其進行研究,可以定義出它的基因。在全中國300多個城市、470萬個地塊,平台都實作了對其多元度的描述。有些次元甚至在實時更新,如人口的熱力圖、交通壓力圖等。描述中既有靜态的名額,也有實時的名額,城市作為一個生命體,被徹底的解構,再也不是靠有多少棟高樓、有多少個停車場來進行淺顯的描述。
此外,我們做到了體征的實時響應和探查,即通過攝像頭監控街道上發生的事件和異常,并通過資料分析該異常産生的原因,做到“實時診斷,秒級響應”。在以往的應急響應中,大都是通過民警的預警或周圍居民的報警,而在今天,這個報警的任務被傳遞給了這個平台。
一座城市的發展離不開經濟,同樣的道理,區域經濟大腦的背後也離不開生産資料、交通資料、能源資料和環境資料。在将這些資料融入經濟資料模型、産業鍊、産業帶進行轉移和變遷的時候,摒棄了以往人工普查的方式,實作了一鍵點選,智能查詢。
該平台不僅适用于城市規劃,也同樣适用于企業。當一家企業經曆了不同年代、使用了不同的資料庫時,會産生一個痛點——各種資料庫的規格、各種資料采集的手段和字段都沒有傳承。這些企業希望存在一個統一的資源庫,并能實作資料的增殖反應。在以往,無序的資料就像下圖中的電線一樣雜亂無章,但是今天借助于Dataphin,可以做到有序資料的實時彙集和傳承,最終實作工具化、自動化、智能化、價值化。
目前看起來似乎智能之路是暢通無阻的。有了這麼多的先進的資料産品,智能社會似乎伸手可及,但是此時此刻所有資料的産生和計算,都是在機房這個基礎設施中進行的。如果我們有非常先進的産品,但是對機房的排程方式卻十分原始的時候,是無法實作智能化的。這種身在20世紀,使用19世紀的理念來實作21世紀的夢想的曆史錯位是行不通的。
在今天,全球的雲計算資料中心運作着百萬級别的伺服器,而這些伺服器的平均使用率隻有6%到12%,這造成了極大的資源浪費,是以如何使用智能算法提升其資源使用率是一個極大的挑戰,讓雲上的使用者能享受更高效、更低成本的服務,讓全社會的基礎運算設施更節能、更環保、更高效。
走向智能之路,既要從人才抓起,又要從産品抓起,也要從基礎設施抓起,這三者缺一不可,這也是整個科技從業者整體的夢想。1982年斯皮爾伯格的電影《ET》中有這麼一句話,外星人看地球時,覺得他們的智能十分低等。但是現在,在地球上,還有另一個ET的存在——ET大腦,今天可以将所有思考的因素和基因注入到萬物之中,讓每一個生物體、每一個基礎設施都具備思考的能力,這樣智能社會的到來也将不再是一個夢想。
讓我們一起奮鬥!