天天看點

阿裡自研NPU将于下半年推出,阿裡雲十年再出發,達摩院加持

2018 年,雙十一之後不久,阿裡巴巴集團 CEO 張勇對阿裡架構進行了重大調整:阿裡雲更新為阿裡雲智能,集團首席技術官(CTO)張建鋒兼任阿裡雲智能事業群總裁。

3 月 21 日,2019 阿裡雲峰會·北京在國家會議中心召開,這是「阿裡雲」更新為「阿裡雲智能」後的首場開釋出會,也是張建鋒上任後首次公開亮相。

阿裡自研NPU将于下半年推出,阿裡雲十年再出發,達摩院加持

阿裡雲「十年再出發」

會上,張建鋒首先闡述了阿裡雲的戰略思考。通過十年,阿裡雲的市場佔有率達到 2-8 名總和。阿裡雲組織架構的更新意味着「阿裡雲」将變成「雲上的阿裡巴巴」,成為「阿裡巴巴經濟體的技術底座」和「阿裡巴巴所有技術和産品的輸出平台」。

阿裡自研NPU将于下半年推出,阿裡雲十年再出發,達摩院加持

阿裡雲前 logo(左)、阿裡雲現 logo(右)

更新後的「阿裡雲」具備以下四個優勢:

1. 技術:達摩院加持的雲。整個阿裡巴巴的技術變成阿裡雲的一部分,達摩院的先進技術作為雲智能的一個基礎部分。

2. 産品,資料智能的雲。産品一定是基于資料智能的、非常穩定可靠的雲。

3. 商業,最佳實踐的雲。「我們和絕大多數雲服務商不一樣,我們是自帶最佳實踐的雲。我們營運了最大的電子商務平台,也營運了最大的支付平台。我們有非常多的技術實踐、産品實踐和商業實踐,阿裡雲是一個最佳實踐的雲。」

4. 生态,被內建的雲。「我們會跟合作夥伴建立更緊密的關系,我們的合作夥伴成功了,我們的客戶成功了,才說明阿裡雲這個雲智能模式、這個系統、這個産品、這個技術是成功的。今天是阿裡雲第一次明确說我們是一個被內建的、生态化的雲。」

張建鋒指出,未來一到兩年,阿裡巴巴 100% 的業務要跑在公共雲上,自己用的技術會跟阿裡雲上的産品保持一緻,将來阿裡巴巴經濟體内的 To B 服務都會通過阿裡雲平台對外輸出。阿裡雲将加大科研投入,持續擴大雲的技術代差;将加大行業戰略性投入,聚焦新零售、新金融、數字政府。

他還表示,阿裡雲将練好内功「被內建」,把阿裡雲變成合作夥伴行業解決方案的一部分。「阿裡雲自己不做 SaaS,讓大家來做更好的 SaaS。」

自研的第一款阿裡巴巴 NPU 将在下半年正式釋出

「三年前成立了達摩院,我們在持續加大投入。在量子計算、機器智能、嵌入式晶片、資料庫進行了廣泛投入。在晶片端我們在 IoT 端嵌入式晶片發展非常快,去年銷售約 2 億片晶片。」張建鋒在會上透露。

很快,網上便出現了「阿裡達摩院去年晶片賣出 2 億片」、「阿裡雲張劍鋒:去年阿裡雲 IOT 晶片賣出 2 億元」等相關報道。機器之心記者就「阿裡 IoT 端嵌入式晶片發現非常快,去年銷售約 2 億片晶片」一事向阿裡雲、達摩院多位公關求證後獲悉,這約 2 億片 IoT 端嵌入式晶片是「中天微」的。

去年 4 月 20 日,阿裡巴巴宣布全資收購中天微。當時,中天微是中國大陸唯一基于自主指令架構研發嵌入式 CPU 并實作大規模量産的 CPU 供應商,專注于 32 位嵌入式 CPU IP 研發與規模化應用,面向多媒體、安防、家庭、交通、智慧城市等 IoT 領域,全球累計出貨超過 7 億顆晶片。

宣布收購中天微的前一天(2018 年 4 月 19 日),阿裡宣布,達摩院在研發一款神經網絡晶片——Ali-NPU, 該晶片将運用于圖像視訊分析、機器學習等 AI 推理計算。

張建鋒透露,自研的第一款阿裡巴巴 NPU 将在今年下半年正式釋出,并且,這個晶片的性能「在這個同等晶片裡面都是非常非常領先的,它不是領先一倍兩倍的問題,是領先十倍以上的。」

與 AI 相關的幾款産品

2019 阿裡雲峰會·北京主論壇上,共釋出了數十款産品,第一個被推出的是神龍異構超算叢集 SCC-GN6。

這款産品采用了英特爾定制的 96 核 CPU,采用英偉達 V100、單機 8 卡、可提供 1000T-TFLOPS 性能,支援 1Tb/s 的高性能 CPFS 并行檔案系統,50Gbps 的 RDMA 高速網絡、時延小于 2us(微秒)。

阿裡自研NPU将于下半年推出,阿裡雲十年再出發,達摩院加持

據介紹,SCC-GN6 是首個基于彈性裸金屬伺服器神龍 X-Dragon 架構的超算異構産品,能将深度學習訓練時間縮短至分鐘級,可滿足無人駕駛、智能推薦、機器翻譯等人工智能場景的高性能計算需求。

在媒體群訪環節,針對「SCC-GN6 能将深度學習訓練時間縮短至分鐘級」這個點,阿裡雲智能創新産品線負責人張獻濤、阿裡雲異構計算研發負責人龍欣、阿裡雲進階産品專家王志坤做了如下拓展:

「在 AI 的深度學習的場景中,特别是訓練場景下,單機的計算力已經沒有辦法滿足在絕大部分場景下訓練訴求,需要天甚至上月的時間才能達到比較好的模型的收斂。在很多場景下,大家希望把多台機器去互聯起來做叢集性運算,去加速模型的訓練。但是這種背景下,傳統虛拟化網絡,其實是沒有辦法滿足在多機訓練場景下的訴求。

在超算場景下,一直有它的一些解決方案,類似于 IB 或者 RDMA 這樣的網絡協定,這種協定天然地和資料中心是不相容的,因為它有安全上的一些問題。

神龍的出現解決了一個什麼樣的問題?不僅解決了計算的實體機互動,還解決了網絡上和虛拟網絡不相容的這樣一個實體網絡的傳遞,通過 RDMA 把我們多台訓練的機器進行互聯。一是,高帶寬的互聯,同時保證了在多機互聯的情況下,我們的線性伸縮比會非常好,這是我們要用一個實體的網絡去把它接起來,把它稱做超級計算叢集很重要的點。這項技術最重要,其實就是我們的神龍技術。」

「單機情況下,我們現在傳遞的是單節點 1000 TFLOPS 的性能,根據客戶需求,可以選擇 8 個節點或者 16 個節點,這個數字就可以做一個簡單的倍加,就得到一個算力。」他們還透露,「最多我們現在單叢集可以支援 512 個節點,就是 4000 個 GPU 的計算力,近似于線性的形式做。人工智能的客戶,比如在一些大模型訓練上面,效率提升是非常高的。」

阿裡雲表示,以 ImageNet 競賽的 128 萬張圖檔的資料集為例,用普通計算資源訓練 ResNet50 模型,如要達到 75% 的精度需要數天甚至一周的時間,而使用該神龍異構超算叢集産品,模型訓練可以縮短到幾分鐘,大大提升 AI 算法研發效率,加速業務創新。

此外,阿裡雲還釋出了國内首個公共雲上的輕量級 GPU 異構計算産品——vGN5i,打破傳統直通模式局限,提供比單顆實體 GPU 更細粒度的服務,進而讓使用者以更低成本、更高彈性開展業務。

會上還推出了機器學習和深度學習平台 PAI v3.0。

阿裡自研NPU将于下半年推出,阿裡雲十年再出發,達摩院加持

據悉,PAI 3.0 推出了全新的算法模型市場,涵蓋電商、社交、廣告、金融等多個行業,數十種場景的算法模型;新增流式算法元件、圖神經網絡、增強學習元件等平台工具。

據「AI 前線」報道,作為機器學習平台的核心,PAI 的智能計算引擎也進行了全面更新,通過編譯技術優化通用計算引擎,訓練性能提升 400%;深度學習優化分布式引擎,單任務支援上千 worker 并發訓練,支援 5k+ 超大規模異構計算叢集;釋出大規模圖神經網絡,緩存機制效率提升 40%,算子速度提升 12 倍,系統端建圖時間從數小時降至 5 分鐘。

「大家可能知道,人工智能今天還不能做到去通用解決任何問題,但是它可以很好地解決在某一個專業領域、專業點的問題。我們也是有這樣一個算法平台開放出來,讓豐富的算法放到這個平台當中,同時提供和過去相比高達 4 倍的計算效率。」阿裡雲智能産品管理部經理馬勁在現場介紹道。

通州區引入城市大腦,防控環境污染

阿裡自研NPU将于下半年推出,阿裡雲十年再出發,達摩院加持

主論壇上,北京市通州區宣布與阿裡雲在生态環境綜合治理方面達成合作。

據了解,通州副中心規劃面積 155 平方公裡。預計在「十二五」期間,新城将初具規模。

由于目前處于施工建設期,如何保障城市環境不受影響成為當地最為關注的問題之一,通州區決定引入城市大腦技術。全區接入了 1437 路城市環境監測視訊、1100 個大氣監測及揚塵預警傳感裝置;打通融合城管委、住建局、環保局等多部門的資訊平台;平均每 10 分鐘就可以完成一次全區域視訊掃描。

通州區副區長蘇國斌介紹,「城市大腦·生态環境」平台在通州上崗以來,實作了通州核心區的環境污染事件從人工發現到實時自動感覺,從多部門多頭處置到一網通辦的本質提升。

蘇國斌副區長還表示,未來水源監測、建築施工、垃圾清理、排污降噪等等也将引入城市大腦相關技術。

本文為機器之心原創,轉載請聯系本公衆号獲得授權。

繼續閱讀