天天看點

Kirin 970完爆A11,但華為手機的真正利器是HiAI移動計算平台

Kirin 970完爆A11,但華為手機的真正利器是HiAI移動計算平台

9 月 2 日,德國柏林 IFA 2017 電子展上,華為消費者業務 CEO 餘承東推出全球第一款手機端 AI 晶片

麒麟 970(Kirin 970)

,以芯、端、雲協同發展戰略積極部署移動端 AI 生态,在演講中,描繪了一幅浩瀚未知而又令人芯馳神往的未來圖景。

25 日,華為在北京召開媒體溝通會,華為 Fellow 艾偉對 Kirin 970 作了進一步的深度解讀;十年來,從 K3V1 到 Kirin 970,華為晶片一路走來,堅守 SoC 政策,持續內建,異構創新;堅持使用者體驗優先,奮力實作從智能到智慧的轉變。下文是機器之心對 Kirin 970 媒體溝通會的報道,希望讀者對這顆「中國芯」有更多了解。

Mobile AI

如果說移動端 AI 革命已經興起,那麼華為 Kirin 970 無疑是打響了第一槍。華為把 Kirin 970 比做智能手機的「新大腦」,它是實作最終智能體驗「Mobile AI=On-Device AI+Cloud-AI」的關鍵;有了 Kirin 970,華為的芯、端、雲戰略才能免于空談,并為後來的移動端 AI 生态布局打下堅實基礎,形成商業閉環。

Kirin 970 CPU 采用 big.LITTLE 架構,内置 4 個用于處理重負載任務的 Cortex A73 核心,4 個 Cortex A53 核心,GPU 則為全新一代具有 12 個核心的 Mali-G72 MP12,所有參數都達到了旗艦産品級别;采用台積電(TSMC)10nm 制程工藝,半導體總數達 55 億;支援全球最高的通信規格 LTE Cat.18/Cat.13,實作了業界最高的 1.2Gbps 峰值下載下傳速率;同時更新了自行研制的 ISP,并且在前一代雙攝 ISP 的基礎上進行了全面更新,其針對特定場景進行了性能和效果優化,可幫助使用者拍出更自然、更美的照片。在硬體參數的更新之外,Kirin 970 最引人關注的新特性就是全新設計的 HiAI 移動計算平台了。

訓練與推斷

Kirin 970完爆A11,但華為手機的真正利器是HiAI移動計算平台

想象一下,如果 AI 是《瘋狂動物城》裡的樹懶「閃電」,這個世界會怎麼樣?答案是 AI 将銷聲匿迹。自 1956 年 AI 誕生以來,三起兩落也罷,百家争鳴也罷,人類始終最希望的是 AI 能夠快速地「學以所用」:不僅要快速地學習知識(訓練),還能快速地應用知識(推斷),讓知識在瞬間爆發出來,這樣 AI 才能為人所用。是以,對知識的及時處理是 Mobile AI 應用的關鍵。

這意味着 Kirin 970 作為手機端 AI 晶片要在知識處理,即推斷上猛抓,且做足功夫,因為全球人工智能的基本趨勢是企業級市場依然是一門「雲生意」,毫無變革念頭;消費級市場則正在從雲端下沉到終端,華為以及蘋果、三星等搶占的正是這塊高地。令人欣慰的是 Kirin 970 在 Mobile AI 方面确實是先聲奪人、先人一步。

Kirin 970完爆A11,但華為手機的真正利器是HiAI移動計算平台

那麼,華為如何提供一套兼顧完備性、個性化和隐私保護的知識模型方案呢?

在日常生活中,人類需要個體智慧和集體智慧互相協同産生更巨大的力量;而未來的智慧終端想要不斷地發展,相應的 AI 體系除了要充分發揮終端自身的能力和價值,也要結合大資料和雲技術帶來的海量資訊、服務和超強計算力,如此才能整合通用知識模型與個人知識模型,激發出移動端 AI 在訓練與推斷方面的雙料潛力。是以不會存在純粹終端的 On-Device AI,否則知識模型的完備性将會喪失。

全球化時代背景下,個性化顯得越發珍貴;在手機中,個性化更是提升使用者體驗的重頭戲。一般來講,雲端多以訓練為主,終端多以 Inference 推斷為主,華為的目前這代 NPU 作為一款 AI 加速器則側重加速端側推斷能力。接下來後面如果 NPU 或者 GPU 可以通過個人資料自我訓練,那麼手機就具備了學習能力,它吸取的個人資料越多就越智能,越個性化,越懂我。并真正做到學以所用,而最重要的是這一切發生在本地終端,省去了隐私洩漏的擔憂。

性能與功耗

Kirin 970完爆A11,但華為手機的真正利器是HiAI移動計算平台

今年 5 月份谷歌推出

TPU 2.0

。TPU 是谷歌研發的一款深度學習加速 ASIC 晶片,第一代 TPU 僅支援推斷(即不可用于訓練模型),并在 AlphaGo 人機大戰中提供了緻勝的算力支撐。目前 TPU 2.0 除推斷以外,還能高效支援訓練環節的深度學習加速。據谷歌披露,32 塊 GPU 并行訓練一整天而完成的深度學習翻譯模型訓練任務,隻需在 TPU2.0 上通過 1/8 TPU Pod(TPU 叢集,每 64 個 TPU 組成一個 Pod)就能在 6 小時内完成。

同樣在今年 5 月,英偉達在 2017 GPU 技術大會(GTC 2017)上正式釋出

新一代處理器架構 Volta V100

,「Volta 并不是 Pascal 的更新,而是一個全新的架構!」英偉達應用深度學習研究副總裁 Bryan Catanzaro 如是說。英偉達通過該架構耗資 30 億美元打造了一款深度學習加速器 Tesla V100,其采用台積電(TSMC)12nm FFN 專屬工藝,包含 211 億個半導體,速度超越 100TFlops,英偉達号稱這是全球最先進的資料中心 GPU,主打企業級超大規模深度神經網絡加速。

以上是 2017 年業界對 AI 處理性能探索的兩個典型代表,Tesla V100 與 TPU2 作為伺服器端的 AI 晶片性能無可挑剔,但前提是它們沒有尺寸的考慮和功耗方面的明顯限制,可以一直插着電,并配有先進的降溫系統,這些要求手機端的 AI 晶片顯然無法滿足。大家知道 Kirin 970 含有 55 億個半導體,那麼它們是如何封裝進指甲那麼小的空間呢?并且需要同時保證性能與能耗甚至還有所提升,這一切不能超出手機電池的承受範圍,其難度可想而知。除此之外,Kirin 970(CPU、GPU、NPU、ISP、DSP)還需要考慮實際 APP 的各種需求,難度就更大了。

面對這一問題,華為如何實作從伺服器端到手機端的跨越呢?答案是華為在傳統解決方案 SoC 的深厚積澱之上,創造性地提出了「HiAI 異構架構」,非常好地異構融合了 CPU、GPU、NPU、ISP 與 DSP,在處理同樣 AI 應用任務時,擁有大約 25 倍性能和 50 倍能效優勢,使 Kirin 970 成為了名副其實的全球首款手機端 AI 晶片和 AI 計算平台。

挑戰

Kirin 970 之後,蘋果随後也推出了手機端 AI 晶片 A11,以及搭載該晶片的 iPhone X、iPhone 8、iPhone 8 Plus,後來居上。華為與蘋果在移動端 AI 方面搶占了其他手機廠商如三星、小米的先機,那麼兩家之間孰優孰劣呢?蘋果無疑是 Kirin 970 目前面臨的最大挑戰。

安卓與 iOS

安卓與 iOS 之間的拉鋸戰迎來了新的範式轉換——手機端 AI 晶片。這一次的變革天然有利于蘋果 iOS。一個完整的手機生态需要算力+開發+硬體,三者缺一不可。蘋果軟硬體高度一體化的封閉生态很适合把 A11 晶片的強大算力順利導給開發者,而開發者借助強大算力把想法通過硬體實作出來,進而形成一個良性循環、上下遊多赢的局面,最終帶來收獲口碑的不二王道——絕佳的使用者體驗。

而安卓系統的開放性所帶來的天然缺陷恰恰是無法把 AI 晶片的強大算力從底層順利導向開發和硬體,進而使得算力打折扣。慶幸的是采用安卓系統的華為手機(以及其他國内手機如小米)通過去 GMS 在相當程度上克服了安卓系統的缺陷,這樣華為在手機系統上并未失利,蘋果華為幾乎在同一起跑線上,兩家真正的共同挑戰在于應用場景與共同體驗。從過往的手機體驗以及 iPhone X、iPhone 8、iPhone 8 Plus 的最新表現來看,華為 Mate 10 似乎承受着不小的壓力。

Kirin 970完爆A11,但華為手機的真正利器是HiAI移動計算平台

這次的溝通會上,華為給出了一個不正常的對标。通過多張拍照效果對比,華為證明 Kirin 970 在拍照上完爆 iPhone 8 Plus。注意,華為給出的對标是自家的晶片與别家的手機,這顯然不對。其實華為真正想說的是 Kirin 970 要比蘋果 A11 牛,不僅是在拍照效果上,在相同網絡模型下每分鐘識别的圖像數量上也是如此(Kirin 970 為 2005 張,iPhone 8 Plus 為 889 張)。Kirin 970 的 AI 性能優于 A11 是可信的,但這并不意味着華為 Mate 10 的最終性能和使用者體驗同樣優于 iPhone 8 Plus,這才是問題的關鍵。

HiAI 移動計算平台

華為 Mate 10 未出,目前一切皆是「雲測評」。或許隻有等到 Mate 10 出來,答案才能揭曉。但這顯然不是手機端 AI 的最後答卷,兩家都有着先發紅利,把握先機、吸引開發者打造爆款應用才是當務之急。Kirin 970 完爆 A11,固然不錯,但 HiAI 移動計算平台才是當下華為手機的真正利器。

Kirin 970完爆A11,但華為手機的真正利器是HiAI移動計算平台

HiAI 移動計算平台推出的最終目的在于把 Kirin 970 的 AI Computing 的能力開放出來,期望更多的 AI 合作夥伴與開發者探索更好的應用。可以說這是大勢所趨,華為别無二擇。Kirin 970 的推出使得華為在移動端 AI 晶片上先發制人,堪稱驚豔,但後續的應用場景同樣關鍵,華為如何做到繼續領先呢?唯有走場景生态的路子,迅速培育出利用 NPU 計算力的殺手級應用,形成商業閉環。HiAI 移動計算平台可謂這次 Kirin 970 溝通會的唯一重頭戲。

Kirin 970完爆A11,但華為手機的真正利器是HiAI移動計算平台

繼續閱讀