天天看點

雲上視覺智能的挑戰與實踐

摘要:人工智能技術已經迎來了第三次高峰,并且勢不可擋,但與此同時,人工智能的商業化之路卻面臨着諸多挑戰。在2019杭州雲栖大會開發者峰會上,阿裡巴巴副總裁、達摩院人工智能中心負責人華先勝就為大家分享了作為開發者應該如何跟随人工智能的浪潮,創造真正的價值。

如今,人工智能技術非常火爆,而視覺智能技術更是火爆中的火爆,以至于融資比盈利的速度還快,這表明了市場對AI的信心,也說明AI産生的價值和大衆期望還存在一定距離。未來,開發者将會對人工智能技術在産業中的落地發揮巨大作用。一方面,人工智能的落地需要開發者一行行代碼寫出來。另一方面,開發者對于人工智能在産業中的優勢和劣勢都有很深入的了解,需要開發者為人工智能的落地實踐出謀劃策。

人工智能在前幾十年經曆了三次高峰,前兩次都隻是夢想,而如今的第三次高峰與前兩次有什麼不同呢?第一,基于深度學習解決了過去的很多問題。第二,具有強大的算力。第三,在各行各業中都積累了海量資料,為人工智能技術以及從資料中挖掘價值創造了條件。第四,已經出現了很多成功案例,如刷臉支付、搜尋引擎以及城市大腦等。

人工智能産業的确在快速增長,2000年到2016年世界上出現了8千多家人工智能公司,2000年到2017年世界上活躍的AI創業公司增加了14倍,2017年167家中國公司獲得總計50億美元的融資,如今各大公司都有了自己的人工智能實驗室,各大高校也有了人工智能學院。可以說,人工智能已經進入了各行各業,并且勢不可當。

雲上視覺智能的挑戰與實踐
那麼,AI領域是否就是一片繁榮呢?其實AI面臨諸多困境,其中第一個困境就是營收。今天超過90%的AI公司都在虧損。一些公司做AI項目,投入的人力成本非常大。另外一些公司做公共API,但門檻又非常低,都快成“白菜”了。
雲上視覺智能的挑戰與實踐
AI面臨的第二個困境就是實驗室與真實世界存在很大差異。在實驗室中,可以将模型和算法刷到非常高的準确率,以至于懷疑機器要超過人類了,而當到了真實世界中,AI從業者的信心遭受打擊,人類的信心才又重新拾回來了。
雲上視覺智能的挑戰與實踐
AI面臨的第三個困境是使用者和客戶對AI的期望非常高,曾經有某個客戶向阿裡提出了120條需求,可是由于技術問題、資料問題或者計算問題,最終隻能實作二三十個需求。
雲上視覺智能的挑戰與實踐

這也促使阿裡巴巴去思考AI技術和應用成功的關鍵因素是什麼。公開測試排名很高,估值很高,融資很好,這些都是成功的因素,但是成功關鍵卻是能否為使用者創造價值。價值也分為三種,從低到高分别為錦上添花、雪中送炭和無中生有。如果AI技術和應用能夠帶來價值,那麼為商業成功買單的就不再是風險投資,也不再是大公司,而是客戶和使用者。

阿裡巴巴在資料上的布局有很多,不僅僅在電商行業,還包括電商周邊和阿裡雲以及各行各業都進行了深入探究。而且很多AI算法需要在場景中不斷地打磨和疊代,才能真正地解決問題。

雲上視覺智能的挑戰與實踐
這裡列舉四個視覺智能技術和應用案例。第一個案例是視覺搜尋。最早在上世紀末和本世紀初就有人在做通用視覺搜尋了,但是當時的資料樣本量遠不如今天。拿拍立淘舉例,它會用到三種技術,第一種是特征學習,需要用特征來描述一個商品的圖象。第二種是大規模搜尋,需要把大量資料放到索引裡面去,友善快速查找。第三種是高性能搜尋,需要能夠快速響應大量使用者的搜尋需求,提供毫秒級回報。
雲上視覺智能的挑戰與實踐
拍立淘是阿裡巴巴第一個視覺搜尋技術的應用,并且每天有千萬級使用者在使用這個功能。為什麼今天拍立淘能夠成功,而上個世紀末的視覺搜尋沒有辦法成功呢?其背後的原因就是剛需。對于電商而言,商品的圖像搜尋是剛需,很多場景下使用者隻能通過拍照的方式才能搜尋到所需要的東西,而通用圖像搜尋目前來看并不是一個剛需。既然是剛需,那麼即便做的不夠好,也會有很多使用者會嘗試使用,随着使用者嘗試的不斷增多,搜尋系統就能夠收集大量的回報資訊來改善自身的算法,否則根本不知道改善方向是什麼。是以,最重要的一點就是關注剛需。
雲上視覺智能的挑戰與實踐
第二個案例是視覺制造,它不是識别也不是搜尋,而是産生視覺産品或者視覺信号,如圖像、視訊等,誇張一點講就是“所想即所得”。這裡舉一個例子,商品頁面秒變視訊,輸入包含圖、文字以及聲音的商品頁面,AlibabaWood系統即會自動地下載下傳這些資訊,分析圖檔并自動地合成視訊,這樣的視訊對于商品的推介作用就會明顯高于頁面,點選率、轉化率都會明顯提升。
雲上視覺智能的挑戰與實踐
第二個例子視訊廣告植入,通過對于視訊内容的分析,将廣告無縫地嵌進去。這項技術會檢測視訊裡面的水、豎直面以及整體空間,并将目标商品的廣告嵌入進去,既不會影響使用者體驗,也能夠對使用者産生影響。
雲上視覺智能的挑戰與實踐
此外,阿裡的鹿班系統可以自動生成平面設計。它可以将素材自動合成設計稿以及廣告圖檔,去年的雙11一共有7億多個Banner,其中4.1億個是由算法自動生成的。經過測試,基本上相當于一個UED大學生的水準,并且一秒鐘可以完成8千個Banner設計。
雲上視覺智能的挑戰與實踐
之前沒有這項技術的時候,Banner需要設計師逐個設計,而如今借助于鹿班的力量,Banner圖已經成了大型促銷活動的标配,這種需求是創造出來的。
雲上視覺智能的挑戰與實踐
第三個案例是視覺診斷,這裡隻談機器視覺診斷。大家從生産線上拿到的很多産品都是需要經過人工多次檢測才能拿到的,而這會耗費很多人力。而很多檢測非常繁雜,并且隻能做抽樣檢測,比如太陽能電池闆瑕疵檢測。如今,借助算法的力量可以準确地進行全量檢測,不僅能夠提升檢測準确率和檢測速度,還能夠節省一半的人力。除此之外,視覺診斷還可以應用于智能養豬等領域。
雲上視覺智能的挑戰與實踐
其實,人工智能在很多方面都可以發揮很大的作用,各行各業都有它的用武之地。不要把目光局限在像人臉、安防這樣的紅海中,作為開發者要知道各個行業存在大量的機會,通過AI技術可以幫助其提高效率、降低成本。當然,做到這一點必須深入行業,因為沒有一種人工智能技術是通用的。
雲上視覺智能的挑戰與實踐
第四個案例是城市大腦,城市大腦是要解決城市大量資料價值挖掘的問題,通過AI算法和算力挖掘城市資料大量的價值。首先要做感覺,要了解城市正在發生着什麼,對于車、人、事、物都要非常清楚的了解。之後做優化,然後就是搜尋和挖掘。再進一步就是預測,預測個體行為比較難,但可以預測群體行為,比如預測車流量。有了預測之後,才可以進行精準管控和提前幹預。
雲上視覺智能的挑戰與實踐
阿裡城市大腦經過3年多的實戰,沉澱出了一系列人工智能的産品,比如天鷹視訊圖像搜尋、天曜異常事件識别、天機城市推演以及天譜城市模組化等。以天譜為例,它是把城市三維的重建和城市二維視訊的分析有機地融合在一起,這樣不僅能對視訊的局部進行分析,而且可以把分析結果還原到三維場景中,進而得到一個全局的資訊。天譜使得對視訊的分析從二維走向三維,對視訊圖象的推理從三維走向了四維。城市大腦慢慢地演變成了部署、研發和創新的平台。
雲上視覺智能的挑戰與實踐
是以,一定要為産業創造不可替代的價值,隻有這樣才能在商業上取得成功。
雲上視覺智能的挑戰與實踐
談到人工智能的未來,技術走向往往很難預測,但是可以總結幾點内容:

  • 今天的人工智能的方法論雖然有局限,但仍有很大的發展空間。
  • 對于傳統産業和數字産業都适用:Embrace AI or Lose。
  • 對于人工智能從業者:Dive into Applications or Lose。
  • 對于人工智能商業化:Create Irreplaceable Value or Lose。
  • 對于每一個人來說:Intelligence Everywhere Embrace It or Lose。

繼續閱讀