天天看點

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

11月15日,科技部召開新一代人工智能發展規劃暨重大科技項目啟動會,公布了首批國家新一代人工智能開放創新平台名單,阿裡雲城市大腦與百度自動駕駛、騰訊醫療影像和訊飛智能語音入選。

阿裡雲城市大腦項目始于2016年,旨在以攝像頭為核心進行資料采集與計算,對整個城市進行全局實時分析,自動調配公共資源,修正城市運作中的Bug,提升城市運作的效率和品質。現在,城市大腦已經成功落地杭州、蘇州等地,解決了很多實際難題,并在2017杭州雲栖大會上交出了一份漂亮答卷:經過一年測試,城市大腦成功接管了杭州128個信号燈路口,試點區域通行時間減少15.3%,高架道路出行時間節省4.6分鐘。此外,在主城區城市大腦對交通事件進行智能報警,日均事件報警數達500次以上,準确率達92%,大大提高了執法指向性,在蕭山區,120救護車到達現場時間縮短一半。

在新智元AI World 2017世界人工智能大會上,阿裡巴巴Distinguished Engineer/VP、阿裡iDST研究院副院長華先勝博士以《城市大腦 - 超級人工智能應用和創新平台》為題,結合應用執行個體,從整個城市的資料,到資料的感覺認知,再到決策、優化、搜尋、挖掘、預測和幹預,一條鍊路下來,系統展示了城市大腦的定位、目标以及價值展現。

華先勝說,城市大腦是一個人工智能、雲計算、大資料等方面的綜合項目。不僅如此,今天看來城市大腦是一個項目,下一步就成為可以批量複制的産品,再将來可能成為平台。城市大腦初期,雖然經常被質疑,但從未被否定,而且一直在進展,下面就是阿裡城市大腦過去一半年的工作比較全面的展現。

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

華先勝:大家好,很高興有機會來和大家一起分享“城市大腦”。城市大腦是一個人工智能、雲計算、大資料等方面的綜合項目。今天它是一個項目,下一步很快就會一個可以批量複制的産品,再将來可能就是一個平台。

城市大腦這件事情是從2016年3、4月份的時候由阿裡巴巴技術委員會主席王堅博士首次提出來的,那時候很多人覺得這件事很不靠譜。但是,經過一年多的時間,我們已經把一個看起來不靠譜的事情做到靠譜,讓大家看到了它的價值的展現。

項目背景:深度學習×計算力×資料,萌生給城市安裝大腦的想法

首先一分鐘時間來回顧一下我們在什麼背景下做了這個項目。大家知道人工智能有三個黃金階段,前兩次最後發現隻是一個夢想,今天是第三次,但這次有什麼不同?會不會和前兩次一樣,仍然會是個夢想。這次黃金階段其實有四個不同點,第一是有深度學習技術,尤其是在視覺領域,深度學習基本上打敗了過去所有的方法;第二是今天有非常強大的計算能力,第三是易于擷取的各種各樣的資料。

第四點,在上面三點的基礎上,我們在很多領域都看到了很多AI的成功應用,包括搜尋引擎,以及我們做過的拍立淘、人臉識别、商品推薦等等——今天的AI推薦系統甚至比你自己都更了解你想要什麼。

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

這些技術發展到今天,讓我們開始想,是不是可以去為城市的資料安裝一個大腦,把城市資料的價值挖掘出來。這件事情反過來會給AI的發展帶來什麼,我們到最後再來探讨。

從宏觀來講,在一萬尺的高空看,城市大腦到底是什麼樣的?城市是一個大量異構資料的聚合體,每天都在不斷地積累大量的資料。其中一類很重要的資料是視覺資料,中國的城市裡有大量的攝像頭,成千上萬的攝像頭24小時都在看着這個城市,這些資料的價值到底在哪裡?難道僅僅是交通處罰和記錄車牌?

現在有了強大的計算能力,有了今天的AI技術,是不是可以重新思考這個問題,把城市資料的價值充分地挖掘出來,讓這些資料産生不可替代的價值,改變我們管理城市的方式,改變我們的生活方式,進而改變這個世界。

城市大腦:經常被質疑,從未被否定,一直在進展

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

我們當時開始這個項目的時候其實有很多的挑戰,不外乎三個關鍵詞:Cost, Value和Difference:第一是它的代價,處理這個城市的視訊資料的代價是否能夠承受, 我們能不能夠做出來?因為我們需要處理整個城市的視訊,處理大量的計算,今天的AI技術、視覺計算的技術,是不是可以把整個城市的資訊充分地感覺,充分地分析和決策,這些方面還有很多的挑戰;第二是能夠産生的價值是否值得這個付出;第三點,過去做智慧城市、視訊監控,以及近期在講的“邊緣計算”,跟我們今天做的有什麼不一樣?最開始我們跟杭州政府合作,杭州市希望我們把它叫“智慧城市”,我們不同意。希望我今天講完之後,大家能夠明白這裡面有什麼不一樣。

我前段時間跟高層彙報時把城市大腦項目的狀态總結成三句話,叫做“經常被質疑,從未被否定,一直在進展”。我們一起看看,我們到底有什麼樣的進展。

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

我們稍微靠近點看,從100尺的距離看,城市大腦是什麼東西?首先,有大量的資料,不隻是視覺的資料,當然今天我們以視覺的資料為主來講它。這些資料來了以後,我們首先要了解這些資料,尤其是視覺的資料。其他的資料,比如GPS資料,拿來做點降噪等處理就能用了,但視覺的資料拿到的是像素,是以第一步要先認知,有了比較全面的認知以後,第二步才是基于這些資料去做決策。

先看第一步認知,比如我們要知道路上有什麼車,有多少人,車和人的行為是什麼樣,交通狀況是什麼樣,有沒有交通事故發生等等。第二步進行決策,有些直接基于視覺感覺的結果就可以進行決策的,比如有交通事故的發生,有擁堵發生,馬上就可以進行對應的處理。另一些更深層的決策是基于曆史和現在的大資料,比如紅綠燈的優化,交通的管控,交通流量的改善等等。再下一步,第三步搜尋和挖掘,我們把視覺資訊和其他資訊放到一個索引裡,就像過去做商品的圖像搜尋一樣,我們可以進行搜尋、挖掘,比如針對嫌疑車輛,找出它前幾天在哪裡,現在在哪裡,活動軌迹是什麼樣的。

有了這些,我們就可以進行第四步的預測。舉個例子,很多GPS給你規劃路徑是沒有預測的,是以看上去這條路線最優,但是走着走着系統會推薦别的路線,這其實是沒有預測導緻的。如果我們能知道十分鐘、二十分鐘、三十分鐘以後每個路口的交通狀況,就可以得出更好的路徑規劃,甚至對交通進行改善、疏導,這就是預測。

預測也可以是更長時間候的預測,例如,如果某個城市明天将會下大雨,還有幾個地方又大型的活動,那我們是可以估計出來明天這個城市在哪些路段會擁堵,哪些路段交通事故的頻率會大幅度增加。知道這些,我們可以提前配置設定人力、警力和醫療資源,進而能更高效應對将要出現的狀況。

第五步是幹預,幹預是建立在預測的基礎上的。可能大家看過一部電影,叫《少數派報告》,這個電影本身是有點反預知。而今天,如果我們能知道明天這個城市在什麼時間段、什麼地方可能有不好的事情發生,我們就可以提前做一些事情去預防這件事情發生,比如明天哪裡擁堵超過一個小時以上,哪個路段事故的機率增加三倍,我們就可以對交通出行進行指導,通過交通燈控制車流等,進而避免不好的事情的發生。

整個一條線下來,在交通和安全領域,我們可以把它看做城市真正有了一個大腦,大家可以看到為什麼我們把它叫“城市大腦”而不是“智慧城市”,因為我們有新的方式,新的功能,城市真的像有大腦一樣,運作變得更加智能。當然,整個城市大腦還有其他的内容,我們今天主要以交通和安全兩個角度來展開讨論。

城市認知演進:希望做到三件事——全面、全量和實時

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

城市的認知有其發展的過程。最早城市是沒有認知的,如果發生了什麼事情,需要走訪,去問問大爺、大媽有沒有看到什麼人或什麼事情。後來開始有安防,安裝攝像頭了,但最初安防行業也不是一個高科技的領域,基本上就是裝攝像頭裝置。後來有很多公司在攝像頭端做了一些智能的算法,這時候就開始有智能在裡面了。

2016年,我們開始做城市大腦,我們希望做的事情有三個特點,我總結為全面、全量和實時。

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

第一,全面(Comprehensive)。因為AI技術的發展,我們可以對整個城市的感覺、認知做得更加完善。比如對車輛的跟蹤、檢測、識别,車到哪裡去,車是什麼類型,要了如指掌。上面這張圖展示了高點攝像頭圖像,雖然這種角度看不清車的細節,但是能大概知道城市裡車輛的數目,比如劃一個區域,就知道這個區域過了多少輛車,區域裡有沒有人經過,我們對整個城市人和車的移動就有了宏觀的把握。

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

這個是通用的人、車、騎行人的檢測識别。我們希望能夠識别盡量多的不同尺度、不同光照條件、不同的視訊品質,就像上排最右邊這個視訊,即便是晃動的,我們一樣能夠做到非常精準的檢測和識别。

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

還有城市裡的異常事件,比如交通擁堵或交通事故,我們都能及時了解,及時報告。很多交通擁堵是事故造成的,如果不及時處理會引發很多的問題。今天發現交通事故是靠人去報,不嚴重的吵吵十幾分鐘,嚴重的交通事故需要有人看見或者在攝像頭裡看見才行,而那麼多攝像頭,隻有很少的人在看。有了城市大腦,我們就能非常及時地發現這些交通事故,嚴重的交通事故我們可能因為能早發現而救人一命,一般的交通事故可以及時緩解因之引起的交通擁堵。

對于全量(Global)和實時(Real-Time),更多是系統方面的工作,也涉及到算法的效率。因時間關系,這裡就不細講了,大家隻要知道一點就可以了:我們的城市大腦是基于阿裡雲的計算平台來建構的。因為有阿裡雲大規模的計算平台,不管是實時的計算還是離線計算,有了這個計算平台,我們建立大規模視訊實時處理的平台就不是十分困難。決策和優化:以杭州交通系統為例

第二,有了這些資訊以後,我們能做什麼?其中兩件事情,一是決策,一是優化。

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

杭州正在運作的系統,對城市的事件事故進行自動檢測和報警

我們看幾個例子,這是在杭州正在運作的系統,對城市的事故自動檢測和報警。每天都在産生實時報告,報告的結果會下放到各個交通大隊,各個交通大隊的人都在看,并根據不同情況采取不同的後續措施。

這幾個圖給了更多的例子,包括碰撞的事故,包括非機動車進入高架路,以及非法停車等等。現在都可以通過普通的攝像頭就可以進行實時的擷取,這些資訊當然就會及時地送給警察,進行後續的處理。

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

普通攝像頭實時擷取城市交通資料,包括碰撞事故,非機動車進入高架道路、非法停車等

如果我們不僅僅知道單個的事件,還知道很多事件在同時發生,或者在同一個地點經常發生,比如說下面這張圖顯示的兩個例子,實際上是兩個路口,這兩處都經常發生交通的擁堵事故和違章事件,這就反映出需要解決的問題。當時這個系統運作一段時間以後,就在杭州自動發現了六個點,交警處理之後情況得到了很大的改善。

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

當然,有了全局的資訊以後,我們就可以做紅綠燈的優化。以前紅綠燈的配置優化是通過地感線圈的資訊去做的,很多細節不知道,而且線圈埋在地下容易壞。今天我們用攝像頭看,過了多少輛車,車的類型,車的走向……看得很清楚,還知道行人的資訊,比如行人有多少,過紅綠燈要多少時間,等待了多長時間,而地感線圈、GPS是無法擷取這些資訊。新的通過視覺收集到的資訊可以放在交通優化模型裡,進而得到更準确的紅綠燈優化配置方案。

還有很多城市有禁止左轉的方法來改善交通,過去哪裡要禁左,要做很多人工調查,對周圍各種情況進行人為走訪,之後才決定哪裡該禁左,哪裡不該禁。今天通過攝像頭的資料,可以看到很長時間以來的交通狀況,到底左轉應該禁,還是應該延長,今天有了這些資訊,我們就可以做到更優的狀态。

搜尋和挖掘:索引城市資料,建立城市智能搜尋引擎

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

我們還可以把整個城市的資訊放在一個索引裡。這裡面有兩個核心的問題:第一是資料量。假設一個城市裡10萬個攝像頭,跑10個小時就是100萬個小時的視訊,而城市一年365天都在跑,大家可以想象這個資料量有多大。

建構一個搜尋系統,我們需要一個大規模的圖像分析處理的流程,然後把圖像的特征放到索引裡去。我們一般有好幾組伺服器來host索引,一組通常也有很多機器,每組機器合起來是一個完整的索引。在搜尋過程當中,使用者送出一個Query 的請求,這個請求會送到其中一組索引的每一台機器裡面,每一台機器傳回的結果,經過一層一層的彙聚以後,最後才會把結果回報給使用者。這裡面有算法的問題,比如在每台機器上能不能做到高效,也有很多台機器協作的問題。後面這是一個系統的問題,兩者配合在一起才能解決效率的問題。

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

第二個難點就是怎麼搜,這是算法的問題,其中最關鍵的就是怎麼去描述物體,描述移動目标、車、人等等。我們以前做拍立淘的時候搜尋的是商品,也是要為這些商品建立一個描述方法,也就是特征。今天深度學習技術為我們帶來很大的便利,我們可以去學習一個特征。我們去設計合适的神經網絡,逼迫這些神經網絡收斂到我們想要的地方,比如像這裡講到有兩種方式,一種是通過識别的方法去逼迫網絡,輸出一組特征,實際上就是一個向量,這種向量能夠在本質上代表你所關注的物體。

還有一個方式叫重新識别損失,包括全局loss,部分loss,特征點loss,這些技術都是為了讓神經網絡收斂到一個地方,讓它能夠用一串數字代表這個物體本質的特征。城市搜尋是比電商搜尋更難的一個問題,在電商搜尋中要找一個商品,假設一輛車,寶馬X5,張三的車和李四的車,實際上是同一件東西。而在城市的搜尋中,我們需要找到張三這輛車,如果傳回的是李四這輛車,哪怕顔色車型都是一樣的,這時候結果也是錯誤的,因為我們要找的就是張三這輛車。這些棘手的地方需要特征學習能夠自動發現物體細微的差别,把這些差别反映在特征裡。

我們正在烏鎮網際網路大會上線這個技術,希望屆時能夠讓大家看到這個技術的真實應用。

城市大腦:今天是項目,明天是産品,未來是平台

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

從整個城市的資料,到資料的感覺,尤其是視覺資訊的感覺、認知,再到決策、優化、搜尋、挖掘、預測和幹預,這一條鍊路下來,我們稱之為城市大腦。當然今天更多是從交通和安防的角度講的,希望将來可以有更多方面的智能,包括資源、電力、醫療等資訊,更多的資料和智能也會在城市大腦裡展現。

我們稍微退回來講一下,城市大腦這件事情與其他的AI技術和應用到底有什麼不同之處?

第一點,它是用今天強大的計算力和AI技術,去發掘整個城市裡不斷積累的大量異構資料的價值。我經常舉的例子,過去的手機隻是用來打電話,今天大屏幾乎成為手機的一個标配,沒有大屏的話很少有人會買它。這是因為大屏成為了今天手機不可替代的部分,因為其有不可替代的價值。城市大腦也是這樣,是要把城市資料的不可替代的價值挖掘、展現出來。

第二點,城市大腦所做的事情超越了單點人工智能的技術,是以有時候我們會把它叫作機器智能。機器智能強調的不僅僅是單點的感覺、認知的能力,而是要把資料彙聚起來,利用強大的計算能力,強大的融合能力,把資料的價值展現出來、挖掘出來。是以我們有時候講,城市大腦實作的是人的大腦不能達到的智能,比如像紅綠燈的優化是人不能達到的,交通事故的感覺是不可能全面鋪開的,一個人看幾個攝像頭可以,但看完整個城市的攝像頭是不可能,包括上層的預測和幹預等,都是沒有辦法通過人力完成的。

第三點,資料成為一種資源,我們希望城市大腦将來會成為一個城市的基礎設施,就像水、電一樣。

城市大腦入選國家新一代人工智能開放創新平台,阿裡iDST副院長華先勝技術解讀

因為深度學習的技術、AI的技術、計算的能力,當然還有裝置、網絡、帶寬等等讓AI有了非常大的飛躍,這讓我們想為城市建立一個大腦,挖掘這些資料的價值。我一開始就講過,今天它看起來像一個項目,我們在杭州、蘇州、烏鎮、衢州等不同的城市逐漸開展,下一步很快它就會成為一個産品,再下一步它會成為一個平台。這個平台必将會推動AI,或者機器智能的進一步發展、壯大和落實。

因為計算的量、資料的量、需求的量,以及它所帶來的影響力和價值都使得城市大腦會成為一個超級的人工智能研發和應用的平台,會需要很多家公司、機關共同來建構。在這個平台上,有非常廣泛的空間提供給大家,讓很多人能夠在這個平台上一起創新,一起挖掘資料的價值,一起來為整個城市帶來驚喜,謝謝大家。

原文釋出時間為:2017-11-18

本文作者:AI WORLD 2017

本文來自雲栖社群合作夥伴新智元,了解相關資訊可以關注“AI_era”微信公衆号

繼續閱讀