
華先勝:非常高興有機會來到這裡分享阿裡巴巴在人工智能方面的研發和實踐,前不久我們看到美國總結了二十項在未來三十年可能會改變世界的技術,我把前十項列在了這裡。可以看到多多少少都和人工智能直接或者間接相關,也就是說人工智能會是将來改變世界的重大動力。
人工智能在曆史上有三次黃金時期,前兩次被證明人工智能隻是一個夢想,今天我們正在經曆的是第三次。這一次還是有些不一樣的地方,比如深度學習技術的提出、超強計算能力的擷取、大量的資料以及不少成功的案例,包括搜尋引擎、AlphaGo、安防領域、電商當中的推薦等等。這些領域已經取得了很多的成功,人工智能正在滲透到各行各業,可是要在行業當中取得成功其中一個很關鍵的要素就是要在商業上取得成功。今天的人工智能可以說是風光無限,常言道“無限風光在險峰,卻是容易翻車處”,怎樣保證在看上去很風光的這樣一條道路上真正獲得成功而不至于翻車呢?我覺得很重要的一個因素就是要在商業上獲得成功,商業上的成功說白了就是要有人為它買單,但這個單應該由客戶來買,而不應該由VC來買。
怎樣才能獲得商業上的成功呢?刷榜、融資、PR、估值還是為客戶帶來真正的價值?我想答案應該是顯而易見的。怎樣才能為客戶帶來價值?什麼樣的價值才是真正的價值?解決一個錦上添花的問題還是解決一個雪中送炭的問題?解決一個個人的問題還是解決大量的問題?作為創業公司和作為大公司,這個方面的看法和選擇的道路可能也會不太一樣。想在商業上取得成功的話絕對不能是昙花一現,要有一定的壁壘才能在一定的時間内都能獲得成功,這個壁壘到底是什麼?算法、系統、商業模式還是客戶關系?今天我想借着剛才IBM總裁講的課題提出我們要深入行業,這個行業也是可以見到壁壘的。當然,不是指行業的客戶關系,而是指深入行業、了解行業、為行業解決實實在在的問題、為使用者帶來實實在在的價值。
今天我想舉的是四個比較典型的例子,智能設計和視覺診斷是第一次講,拍照搜尋和城市大腦之前講得比較多,背後其實還有很多不成功的例子,但今天主要還是講一講成功的部分。
智能設計:千人前面,每天自動生成5000萬橫幅廣告
首先是智能設計。這是人工智能還沒有太多觸及的行業,也有人認為這是有點偏藝術的行業,人工智能和藝術還有一點距離,實際上還是有很多很有意思的事情可以去做。設計行業的從業人員大概有4000萬,整個中國市場容量是3000億元。它的難度在于設計的效率是非常低的,有很多繁瑣的體力勞動,是以我們需要設計師的支援。今天我會講其中的一個平面設計的例子,比如電商的網站上經常可以看到很多的廣告圖,我們把它叫做Banner,要有商品的名稱、推廣詞和各種各樣吸引使用者點選購買的詞語。這樣的Banner過去都是要由人來設計的,大家可能不知道“雙11”這一天需要多少Banner,大概是7個多億的級别,過去都是需要人工來完成的。這裡給大家播放一部短視訊,看一看這樣的設計是不是可以通過機器來完成。
我們有了這種自動設計以後,可以實作千人千面、千貨千面,也就是說不同的人看到同一個貨物會看到不同的廣告,合起來就是千人千貨千千面。去年“雙11”的時候是有7億多個的Banner,其中4.1億是通過算法完成的,幾天的時間當中每天産生5000萬個Banner,産生以後就上線使用,沒有任何人工幹預,是以也是有很多的技術難題。
大家可能會覺得很奇怪,我們到底是怎麼做出來的?是和設計師合作嗎?當然,我們一定要和一流的設計師合作,選擇合作夥伴也是非常重要的,一定要選擇最頂級的設計師。同時我們提供兩種工作模式:一種是像剛才講的大批量的模式,一下子生成幾千萬。另一種是互動的模式,提供工具讓設計師的工作變得更為便捷和高效,也讓他們的飯碗變得更好。
另一個例子是拍照搜尋,解決的問題就是用不同搜尋商品的入口,看到好東西拍照就可以了,不需要輸入文字。這個技術以前我也講過,通過拍照片分析物品的種類,然後識别它的位置,最後突出它的特征,然後在大量的搜尋庫裡面進行檢索,最後把結果呈現給大家。
視覺診斷:從電池闆瑕疵到列車故障
視覺診斷其實有兩類:一類是醫療行業的診斷,我們講的更多的是機器裝置的診斷。這是一個大海撈針的問題,因為需要檢測的樣本是非常多的,可是有毛病的并不是很多,為了保證把有毛病的找出來不得不挨個去看。我們的技術就是要做到從大海撈針變成桌面找針,這是其中的價值,就是節省了人力,可能也會提升品質、節省成本、增加安全性。
電池闆瑕疵的檢測、蠶絲瑕疵診斷、列車故障診斷,這些也是比較直覺的,但我們要深入了解行業的問題才能為客戶解決真正的痛點。現在行業診斷的現狀有三種模式:首先是全人力,成本的消耗是非常高的。如果有攝像頭,人不需要到實地,但還是要有人在屋子裡看,這也是非常繁瑣的活,每天對着枯燥的樣本看的話會漏掉很多東西。或者它們有一定的智能,但沒有達到全自動的目标。
這裡也有很多類似的問題,有些是視覺可做的,比如鐵路路軌的松動、電池裂紋、晶片溢膠量等等;有些是比較難做的,但還是比較靠譜的,肉眼能夠分辨但有一定困難,比如元件毛發連接配接、拉鍊方塊斷裂,還有一些就不太容易了,比如内胎壁厚薄檢測、稻殼含水量計算。之前有個生産線上的問題,就是裝肥皂的盒子裡面沒裝,怎麼檢測出來呢?一堆博士設計了很複雜的方案,包括X光等等,花了很多的錢,最後有個勞工在旁邊放了個電扇,一吹就把它吹下去了。有些問題不見得要用這麼複雜的方法解決,是以我們要選擇人工智能可以帶來真正價值的問題。
這是太陽能電池片裂紋的檢測,每年在行業當中要花千萬級别的人力去做人工檢查,今天機器就可以做到非常高精準,基本上沒有漏的,誤報也是比較低的,誤報率将近3%的情況下節省的人力目前還沒有達到理想的階段,大概相當于原來1/10到1/20,再進一步下降的話人力就完全實作自動。
列車故障診斷也是一個例子,我們經常坐火車,如果不檢查的話是很危險的,其實在列車進站的時候都是會有人檢查的,最早的時候是人要到站台檢查,後來是拍很多的照片,列車進站的時候拍上萬張照片送到一個屋子裡面由人來檢查,大家就知道這個工作有多麼枯燥無味了。現在我們通過算法,人檢上報68%,機檢上報更多,人的漏檢是非常多的,大概是141個,機器可以非常客觀地把故障檢測出來。
現在我們正在各行各業去試,我們推出一個阿裡視覺診斷的引擎,希望能夠在各行各業把這些技術總結起來,支撐更多、更好、更便捷的應用場景。
城市大腦:無處不智能
很多人都知道城市大腦這個項目。兩年前我們開始這個項目的時候很多人覺得不太靠譜,現在外面的形勢發生了很大的變化。解決了什麼問題呢?其實解決的就是城市大量資料價值挖掘的問題。每天城市有大量的資料在積累,尤其是視覺的資料,今天視覺的資料可以用來幹什麼?可能是交通罰款,可能是事後斷案,這裡巨大的潛力遠遠沒有被挖掘出來,今天AI的技術和計算的能力能不能進一步挖掘這些資料的價值?包括帶來城市服務智能化、資料化,實施高效低耗,省人力又便捷的服務,也就是城市治理模式、服務模式和産業發展的突破。
業界的現狀是怎樣的?雖然城市有很多的監控,或者說感覺的裝置,但還是有三個問題:首先是盲人摸象,就是單點的資訊,大量的實體裝置是損壞的,視訊裝置還遠遠沒有被利用起來。另外就是燈下黑,裝置當中智能的含量是非常少的,即便有智能,它的水準也是值得進一步改進的。在這種情況下,大量的攝像頭需要人去看,但人沒有這麼多精力去看,今天我們是不是可以用技術自動去做全量攝像頭的智能分析?霧裡看花,已有的感覺手段難以發現這些現象,比如不安全因素背後的原因。
我們的城市大腦要做的是什麼事情呢?目前城市大腦主要有這樣幾個應用場景:
資料出來以後要對整個城市進行全面、實時、全量的感覺,攝像頭看到的所有事情,包括人、車、物、事四個要素,全部都要了如指掌。有了這些以後就可以進行決策和優化,比如實時事故的報警、交通信号燈的優化。有了這些以後我們還可以把所有的視覺對象放到搜尋引擎裡面,就像剛才電商的搜尋一樣,城市當中的所有目标放到搜尋引擎當中,這樣可以很容易地找到肇事車輛和丢失的兒童和老人。
雖然我們沒有預測每一個人的行為,但我們可以預測群體的趨勢,比如預測二十分鐘後交通的流量是怎樣的。有了這些預測,甚至可以進行更長時間的預測,比如對明天的預測,如果預測的情況不太好的話可以提前幹預,不要讓不太好的事情發生,比如事故的機率增加、交通擁堵嚴重等等,進行提前的交通管控和疏導的處理,使得交通不要出那麼多的問題。
最早的感覺其實叫做無感無知、感而不知和感而略知,今天我們在雲上做的城市大腦是要做到感而全面知、感而全量知和感而實時知。因為今天的技術發展和算力的提升可以對整個道路的情況進行更詳細、更準确的感覺,包括車、人和物,包括各種事件的檢測。
全量實時的感覺其實是依賴于系統,我們是建立在阿裡雲的實時計算系統,建立大規模的實時視訊處理系統。這裡很重要的就是效力要足夠高,當時我們做了很多的工作,其中的一個功能就是用機器替代交警的行為。
有這麼多的球機需要我們去看,杭州一個很小的範圍有兩百多個球機進行巡邏,可以代替兩百多個交警的人力。發生交通事故以後,我們很快就可以判斷哪裡出了事情,一輛車停在哪裡。全天候全面的交通事件感覺,不同的天氣、不同的光照當中非常小的目标都可以進行精準的檢測和事件事故的報警。
如果要對一個地方的事件事故報警進行長期的統計,我們可以看出一些規律,哪裡經常有報警就說明有些問題,我們就要進行線下的處理和改善,改善之後報警的情況就會發生變化。
我們利用城市大腦既有的監控裝置發揮最大的效力,解決了交警的痛點問題,在不增加外場裝置、不改變現有鍊路的情況下,通過視覺雲計算、物聯網技術迎來了一次新的性能提升。我們也在開始做AI晶片的嘗試,使得成本進一步降低。
我們不僅是為城市解決這些問題,同時還要建構一個平台,使得城市的計算和場景成為人工智能的開放創新平台。這裡黃色的部分其實是留給第三方一起建立城市計算的智能。剛才講的人工智能是在各行各業,我們必須深入這個行業。
Intelligence Everywhere是不可替代的趨勢,一些複雜的腦力勞動隻要是有規律的,也有可能會被替代,更高大上的可能還有空間,但人工智能會成為他們的助力,從業人員如果要人工智能真正落到實處,就要深入行業,去創造一個未來。
原文釋出時間為:2018-04-2
本文作者:新智元AI技術峰會
本文來自雲栖社群合作夥伴新智元,了解相關資訊可以關注“AI_era”微信公衆号