飛天 AI 平台首次亮相
阿裡的 AI 能力再上新台階。在雲栖大會第二天,新任“阿裡雲智能計算平台掌門人”、阿裡巴巴集團副總裁、阿裡雲智能計算平台事業部總裁賈揚清正式對外釋出飛天 AI 平台。
飛天 AI 平台是賈揚清入職阿裡巴巴後首次釋出的機器智能産品。采訪中,賈揚清向 AI 前線展示了飛天 AI 平台的“硬”實力。
飛天 AI 平台到底是什麼?
我們先聽一下賈揚清的定義:“這次釋出的飛天 AI 平台,不僅是阿裡 AI 整體能力的結構化展示,更是一個開發者更易觸達的 AI 平台,開發者在飛天 AI 平台上,可按需調用平台的能力,無論是軟硬體一體的程式設計環境,還是雲邊端一體的高性能訓練和推理引擎;無論是阿裡雲已經開源的能力,還是成熟的商業版服務。”賈揚清表示,“這些都會讓開發者擁有更多自主可控的技術路線、同時擁有更加強大的 AI 能力”。
據了解,飛天 AI 平台主要包含兩層:高性能訓練與推理引擎架構,多模态算法開發與部署平台。

架構層面:
飛天 AI 平台包含 Alink(FlinkML)、MNN(輕量級深度學習端側推理引擎)、XDL(面向高維稀疏資料場景的深度學習開源架構)、SQLFLOW、PAI TensorFlow(阿裡雲優化的商業版 TensorFlow)、PAI Blade(編譯優化)、Elastic DL 等;
性能層面:
- 飛天 AI 平台通過資源排程能力優化,可提升 30%GPU 叢集使用率;
- 在大規模稀疏模型訓練場景下,相同資源最高提升 7 倍性能;
- 接近理論的線性的分布式訓練擴充能力;
- 以及普惠的系統自動編譯優化能力。
AI 開發與部署平台層面:飛天 AI 平台是一個自帶最佳實踐的互動式 AI 開發平台,他将 AI 程式設計系統和大資料程式設計系統有機結合,在開發者實際操作過程中,不同崗位、不同技術背景的工程師之間往往有設計理念及技術實作細節上的差異,随着業務複雜度、技術複雜度的增加,這種差異帶來的影響被進一步放大。飛天 AI 平台經過多年的沉澱、打磨,在阿裡巴巴集團及阿裡雲業務的實踐中,積累了一整套“曆經實戰演練”的資料處理、特征工程、算法、評測元件,并以子產品化的方式通過統一的 AI 開發環境提供标準服務,解決實際業務問題。
- 開發者一站式拉起的輕量級 AI 開發平台
- 資料科學家更加喜愛的大資料和 AI 協同開發平台(全新功能)
- AI 推理服務平台
賈揚清表示,與目前市場上的 AI 平台相比,阿裡飛天 AI 平台最大的不同點在于它是阿裡自己在用的 AI 平台,如電商搜尋、個性化推薦、廣告、智能語音客服、無人駕駛、城市大腦等,都是在飛天 AI 平台上開發出來的,這也是飛天 AI 平台“學以緻用”的最佳展現。
此外,飛天 AI 平台與它的“孿生兄弟”飛天大資料平台緊密結合,形成了飛天 AI 平台的一大特色。大家都知道大資料技術是 AI 發展的重要基礎,而在今年 9 月,飛天大資料平台的自研大資料計算平台 MaxCompute 和開源大資料計算平台 E-MapReduce 分别在 TPCx-BB 和 TPC-DS,首次将資料集規模拓展至 100PB,并在 30TB 資料規模排名中雙獲第一。放眼市場,能夠将大資料和 AI 技術完整結合,并取得如此成績的平台可能隻有阿裡一家。在賈揚清看來,在 AI 更廣泛落地的大背景下,單純用一個深度學習平台或架構做計算是不夠的,一定要跟大資料平台緊密結合。
賈揚清強調,作為一個平台,飛天 AI 平台所提供的能力是讓開發者能夠利用這些能力進行應用更新,平台關注的應該是給開發者、給上面的應用提供和創造更多的可能性。
接下來,飛天 AI 平台和飛天大資料平台、達摩院将建構起資料、算法、計算的 AI 生态閉環,更好地為開發者服務,為客戶創造價值。
阿裡 AI 核心看達摩
在今年的雲栖大會上,AI 悄然占據了 C 位,多項關鍵性創新技術成果的釋出代表着阿裡技術長征又邁向了一個新的階段。
阿裡對于 AI 的最早布局,要追溯到 2014 年,一個神秘部門的誕生。
彼時,在矽谷上市活動剛結束不久,阿裡便宣布在矽谷建立 iDST(institute of Data Science&Technologies,資料科學與技術研究院),自那以後,馬雲對外的演講裡便高頻出現“DT”這個詞,在 IT 概念還未褪熱之時,馬雲提出的“DT”也着實時髦。
iDST 自誕生起就萦繞幾分神秘色彩,它甚少在出現在媒體報道中,鮮有人知道,這個單從名字上看研究資料科學的部門到底在做些什麼。它的目标在那時也顯得格外宏大,确立阿裡巴巴集團在未來數十年的技術領先地位。
iDST 的奠基團隊裡,大咖雲集。現任阿裡巴巴達摩院進階研究員,機器智能實驗室負責人金榕和螞蟻金服副總裁兼首席資料科學家漆遠是 iDST 的兩位創始人,二人都是應王堅之邀加入阿裡。
“阿裡巴巴是坐在金山上啃饅頭,阿裡擁有龐大的資料金山,而資料的真正價值卻并沒有發揮出來”,王堅拿出了當年彭蕾遊說他的理由招徕漆遠,令王堅吃驚的是,“他真的非常果斷就來了”。之後,華先勝、周靖人、任小楓等頂尖科學家陸續加入 iDST。
“阿裡 AI 戰略發展過程中,最大的轉折點是被團隊裡很多前輩稱之為‘上山下鄉’的運動”,阿裡巴巴達摩院語音實驗室負責人鄢志傑回憶他在 iDST 時的日子,“我其實加入三個月後,就開始擁抱變化了,我被‘下放’到業務團隊,到了阿裡雲 iDST”。
當時 iDST 的團隊成員多為科學家,他們重視基礎理論研究卻缺乏業務和實戰經驗,常被業務部門批評“不懂業務”。于是,為彌合這兩種沖突,iDST 的團隊兵分三路“下鄉”,深入到業務團隊之中:金榕帶領一撥人加入了淘寶和天貓的搜尋部,漆遠和幾位同僚去了螞蟻金服,原先做語音的團隊留在了阿裡雲。
經過“上山下鄉”運動後,iDST 從直屬集團變成了阿裡雲下屬的一個部門,看似力量削弱了不少,但實際上通過這三路”尖兵“,阿裡的 AI 技術能力在各個核心的業務場景中全面開花。金榕去淘寶、天貓搜尋部後做出了拍立淘,還拿到了阿裡最高榮譽“集團 CEO 獎”,漆遠去了螞蟻金服後,也收獲了 6 項阿裡巴巴集團算法大獎。
如今,iDST 更新為達摩院并成了阿裡的核心技術中樞,但達摩院做技術布局與研發的思路仍與 iDST 一脈相承,并在原基礎上做了延伸和發展。
2017 年,達摩院宣布成立時,馬雲對它寄予厚望,他希望即便有一天阿裡沒了但達摩院還在,達摩院必須活得比阿裡巴巴更長。兩年過去了,達摩院逐漸成為阿裡前沿技術實力尤其是 AI 實力上的代言者。
目前,達摩院關注機器智能、資料計算、機器人、金融科技以及 X 實驗室五大領域,設定有 14 個實驗室。其中,機器智能實驗室是阿裡做 AI 研發最核心的部門,是阿裡 AI 力量的彙聚地,其下設語音、視覺智能、語言技術、決策智能、城市大腦五個實驗室和一個智能客服團隊,這些基本涵蓋了阿裡在 AI 技術方向上的核心布局。機器智能實驗室的負責人金榕向 AI 前線表示,阿裡将技術劃分成三個層面:基礎技術、業務技術、應用技術,并按照這個邏輯標明了上述研究方向。
在傳承 iDST 的基礎上,機器智能實驗室的定位也發生了一些變化,其在為當下的 AI 技術做布局的同時,也在為未來技術來做一些基礎性的研究,金榕表示。
阿裡巴巴達摩院語音實驗室負責人鄢志傑回憶,伴随着 iDST 的架構設立,阿裡開始對以語音互動等技術進入嚴肅投入期。發展到一定階段和規模的阿裡需要做一些技術儲備,從這個角度上看,iDST 的布局是有一定前瞻性的,到現在的達摩院,也一直貫徹同樣的思路。
又一年雲栖至,這一年來,機器智能實驗室有哪些技術創新和進展?金榕向 AI 前線介紹道:
在自然語言處理方面,最大的進步是深度語言模型,如今自然語言處理最大的挑戰是如何讓将人類語言變成數學能夠表達的東西,過去語言模型隻是比較簡單的統計,現在的深度語言模型可以做到把語言很好地映射到數學空間上,這是一個很大的進步。深度語言模型另一個比較成功的應用是在問答上,又叫做機器閱讀了解,它跟一般的問答不同在于,過去 AI 問答一般需要事先設定一些 QA Pair,所有問題都需要判斷它跟 QA Pair 中的哪個問題比較像,再傳回對應的回答。現在的機器閱讀了解可以直接給機器輸入一篇很長的文章或多篇文章,模型可以從文章中自動搜尋跟問題有關的答案。
計算機視覺方面:過去阿裡最大的一項突破就是超大規模圖像識别,目前阿裡超大規模圖像識别技術已經可以做到幾千萬 SKU,所有物品在阿裡商品庫均能做到 87% 左右的識别率,其中的核心是如何有效進行大規模訓練和優化。金榕希望未來這個 SKU 還能再推到幾個億。
語音方面:目前阿裡的語音合成技術已經能做到跟真人非常接近的程度,并被收錄到了 MIT 2019 十大突破性技術中,與谷歌、亞馬遜同屬行業前列,其技術實作上借鑒了機器翻譯的一些方法。此外,阿裡的語音合成技術不僅能在 Profile 上實作很好的效果,研發團隊還花了大量時間精力使模型的計算成本降低了一個數量級,進而很好地彌合了研究與商業化應用之間的鴻溝。
以下為達摩院兩周年的成績單:
鄢志傑表示,目前在阿裡集團内部的電話客服、政務、智慧地鐵等多業務場景都用到了語音互動技術能力。近幾年阿裡在語音互動領域取得的重大技術成果主要展現在兩方面,一是,語音識别的聲學模型在互動效果上更加自然。二是,去年釋出的業界最小的語音模組真正做到了簡單“複制”與機器互動的能力。在本次雲栖大會上,這個模組又有了最新的更新:體積更小、功耗更低、更便宜、更易被內建。這裡的“被內建”指阿裡的語音技術可以幫助其他在語音互動領域探索的客戶做業務更新。
“在我們團隊,禁止講‘賦能’”。
賦能無疑是當下科技網際網路圈常用的高頻熱詞之一,阿裡為何禁提“賦能”?鄢志傑繼續解釋道,很多傳統企業在垂直領域深耕多年,專業能力紮實,阿裡的技術并非為其賦能,而是幫助客戶産生價值,阿裡技術的價值在于将門檻降低、讓更多人使用,進而産生廣泛的社會價值。
現在,達摩院更多扮演了阿裡巴巴 AI 技術中台的角色,其核心能力通過雲來輸出,當小前台需要語音、圖像等技術的時候,技術中台會為其提供源源不斷的技術服務和支援。
科學家下田野
曾經在較長的時間裡,很少有人會覺得阿裡是一家技術公司。“百度的技術、騰訊的應用、阿裡的産品”,業界常認為在 BAT 中,阿裡是技術實力最弱的,片面印象的形成除了阿裡強大的電商基因,還因為英語老師出身的馬雲不懂技術,這在技術公司中是少見的,不論是李彥宏、馬化騰還是張一鳴、雷軍、周鴻祎、丁磊等人皆是程式員出身。
兩年前,在達摩院成立時,馬雲談到這點時說道,“我沒覺得不懂技術多丢人,不懂技術裝得懂技術才丢人。我确實不懂技術,但我們尊重技術、欣賞技術、信仰技術”。
今天,可能已經很少有人否認,不懂技術的馬雲帶出了一家技術最強大的公司之一。甚至有觀點認為阿裡在技術上的成功恰恰是因為馬雲“不懂技術”。
2018 年 10 月 31 日,在退休之前,馬雲最後一次以董事局主席的身份緻信股東,他表示,9 年前阿裡已經轉型為一家技術公司,已在大資料、雲計算、人工智能、物聯網上做了全面布局和準備。
“阿裡在商業上的成功掩蓋了它技術上的實力和投入“,阿裡巴巴首席技術官行癫(張建鋒)曾感慨,言語之間夾雜着些許“委屈”的情緒。
普華永道釋出的《2018 全球創新企業 1000 強》報告中顯示,阿裡巴巴的研發支出連續三年居中國上市企業之首。2018 年,阿裡研發支出達 247 億元,是騰訊的 1.3 倍、百度的 1.8 倍、攜程的 2.7 倍、京東的 4 倍,其最近兩年的研發費用占總收入的比例高達 15.65%。
伴随着人工智能熱潮的來臨,BAT 紛紛擁抱 AI。在 AI 的布局上,三家也各有千秋。
百度對 AI 的布局是最早的,阿裡次之,騰訊最晚。2013 年 1 月,百度宣布成立深度學習研究院(IDL),李彥宏親自擔任院長,同年 4 月,百度深度學習研究中心在美國成立。為布局 AI,百度先後招徕了吳恩達、陸奇等 AI 大神加盟。在百度的 AI 布局中,百度大腦、自動駕駛、百度智能雲是重點押注的方向,百度大腦整合了深度學習、語音技術、視覺技術、自然語言處理、知識圖譜等核心技術,目前已經更新到 5.0,且由百度大腦核心能力支援的 Apollo 和 DuerOS 兩大 AI 開放平台的生态體系漸豐。在自動駕駛方面,百度在該領域的專利申請量居國内第一。
相較 BA,騰訊在布局 AI 上有些後知後覺。在 2017 年 11 月的騰訊全球合作夥伴上,騰訊 CEO 任宇昕将“AI in all”作為騰訊發展 AI 的願景。在去年 9 月進行的第三次組織架構調整中,雲和 AI 被騰訊視為擁抱“産業網際網路”的關鍵武器。在内部,騰訊的 AI 力量較為分散,主要有騰訊 AI Lab、騰訊優圖、WechatAI 三大實驗室,專注計算機視覺、語音和語義了解、自然語言處理和機器學習等方向,因為存在賽馬機制,三大實驗室關注的研究方向會有重合之處。近兩年,騰訊一直倡導“科技向善”,試圖将其打造成騰訊 AI 具有辨識度的标簽。目前,在計算機視覺領域,騰訊 AI 優勢明顯,其在醫療、金融、零售方面的應用較強。
依托電商場景和資料金礦優勢,阿裡在智能客服、語言 / 語義了解、自然語言處理、計算機視覺等 AI 研究方向上具有顯著優勢。阿裡最早做 AI 時主要是業務驅動,完全從算法角度做,現在越來越完善,從算法到架構到硬體,最近兩年,在軟體之外,阿裡 AI 還在向硬體發力。去年 9 月 19 日,在 2018 雲栖大會上,阿裡巴巴 CTO、達摩院院長行癫宣布成立平頭哥半導體公司。成立近一年來,平頭哥先後釋出了晶片玄鐵 910 和一站式晶片設計平台 “無劍”。
在 9 月 25 日雲栖大會現場,阿裡巴巴 CTO 行癫(張建鋒)釋出了由平頭哥研發的阿裡巴巴第一顆“大晶片”—含光 800,據稱它是全球最高性能的 AI 推理晶片,在業界标準的 ResNet-50 測試中,含光 800 推理性能達到 78563 IPS,比目前業界最好的 AI 晶片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。随着含光 800 的釋出,平頭哥端雲一體全棧産品系列初步成型,涵蓋處理器 IP、一站式晶片設計平台和 AI 晶片,實作了晶片設計鍊路的全覆寫。
“在全球晶片領域,阿裡巴巴是一個新人,玄鐵和含光 800 是平頭哥的萬裡長征第一步,我們還有很長的路要走”。 張建鋒表示,阿裡巴巴未來将用“軟體的優勢”、“網際網路公司的速度”做晶片,目标是轉型為一家軟硬體協同一體化的科技公司。晶片或許會成為阿裡布局 AI 生态具有辨識度的一個标簽。
在技術公司轉型的過程中,阿裡強大的電商基因與技術戰略互相融合,倒是形成了一種饒有特色的新特點。場景能夠與技術深度融合是阿裡發展 AI 技術最大的優勢和發展政策。縱觀如今的 AI 創業公司發展現狀,90% 的 AI 創業公司燒錢太厲害卻賺不到錢,根源在于找不到合适的落地場景、天然具有大規模應用場景、業務倒逼技術發展的阿裡則很好地規避了這個問題。
達摩院成立伊始,馬雲就曾直截了當地告訴王堅,這 1000 億啟動資金給你就是創業啟動資金,未來是要靠自己掙錢的,90% 以上研究的東西,不能隻在實驗室裡面,必須在市場上。馬雲認為,隻有讓企業家和科學家完美結合,這個世界才有未來。
“阿裡有一大特色,叫做科學家下田野,科學家也會去見客戶”。
鄢志傑打趣地說道,這個特色在 iDST“上山下鄉”運動時已經展現得淋漓盡緻。他認為,商業價值倒逼需求也是阿裡 AI 的與衆不同之處,“AI 技術怎樣上雲,如何幫助阿裡雲生态的夥伴創作價值,在一定程度上,這并不是一個主動選擇,而是一種被迫選擇,是阿裡雲天然使命的倒推。除了刷榜和純技術因素以外,一項技術能夠給社會産生什麼樣的價值,阿裡雲在這方面的思考比别人早一點。現在看到,别人也都走上這條路了。在聽到來自市場、商業環境前線的‘炮火’的時候,阿裡希望去做一些真正對 AI 産業化産生影響力的産品”。
擁抱 AI 已經成了全球科技公司的主流戰略,但不同的公司有各自的技術路線,賈揚清覺得阿裡最大的優勢是學以緻用,與很多公司通過算法需求往下設計系統、搭建架構不同,阿裡是一個囊括底層架構、硬體等的更加全棧的環境,上面的業務需求、應用很容易通過融進業務中接受到大規模的錘煉并找到接下來的演進方向。
阿裡 AI 全景圖
一般而言,衡量和評判一家公司的 AI 實力,需要從三個次元做考量:系統能力、算法能力、應用能力。系統能力主要考慮 AI 的基礎架構、軟體協同設計,可從整個開發者平台的實力、落地場景中展現出來;阿裡的算法能力主要展現在達摩院上,如在圖像識别方向的算法研究上,阿裡已取得顯著成果。應用能力的目标是希望讓每一個人都非常自然地使用 AI,談到該能力,賈揚清認為,目前整個業界在 AI 應用層面還處于早期階段,應用能力的提升是最終讓“AI 擁有無限可能”的必經之路,這也是阿裡推出飛天 AI 平台的目标所在。
今天,阿裡巴巴首次公布了其人工智能調用規模:每天調用超 1 萬億次,服務全球 10 億人,日處理圖像 10 億張、視訊 120 萬小時、語音 55 萬小時及自然語言 5 千億句。
一年前,金榕曾在接受采訪時表示希望能夠幫助阿裡巴巴從一個技術的跟随者變成上司者,并在一些重要技術上取得領先。現在再來看這個目标,金榕欣喜地看到阿裡 AI 發生了兩個很重要的變化:已經不少團隊在順着這個目标為核心去努力,且有很多團隊不僅在考慮解決當下單純的業務問題,而着眼到更遠處希望解決未來根本性的問題。
“我認為這兩件事能夠讓阿裡在未來做到 Leader。做 Leader 一定是一個堅持的過程”。
原文連結:
https://www.infoq.cn/article/DpTcxmsVcpD4clq2p5VB