![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLicGcq5CNjRjZkhTNlBzMmlDO0ADOhFmZ0kzY2UWOmFzNlJGZh9CX5d2bs92Yl1iclB3bsVmdlR2LcNWaw9CXt92Yu4GZjlGbh5yYjV3Lc9CX6MHc0RHaiojIsJye.jpg)
9 月 2 日,德國柏林 IFA 2017 電子展上,華為消費者業務 CEO 餘承東推出全球第一款手機端 AI 晶片
麒麟 970(Kirin 970),以芯、端、雲協同發展戰略積極部署移動端 AI 生态,在演講中,描繪了一幅浩瀚未知而又令人芯馳神往的未來圖景。
25 日,華為在北京召開媒體溝通會,華為 Fellow 艾偉對 Kirin 970 作了進一步的深度解讀;十年來,從 K3V1 到 Kirin 970,華為晶片一路走來,堅守 SoC 政策,持續內建,異構創新;堅持使用者體驗優先,奮力實作從智能到智慧的轉變。下文是機器之心對 Kirin 970 媒體溝通會的報道,希望讀者對這顆「中國芯」有更多了解。
Mobile AI
如果說移動端 AI 革命已經興起,那麼華為 Kirin 970 無疑是打響了第一槍。華為把 Kirin 970 比做智能手機的「新大腦」,它是實作最終智能體驗「Mobile AI=On-Device AI+Cloud-AI」的關鍵;有了 Kirin 970,華為的芯、端、雲戰略才能免于空談,并為後來的移動端 AI 生态布局打下堅實基礎,形成商業閉環。
Kirin 970 CPU 采用 big.LITTLE 架構,内置 4 個用于處理重負載任務的 Cortex A73 核心,4 個 Cortex A53 核心,GPU 則為全新一代具有 12 個核心的 Mali-G72 MP12,所有參數都達到了旗艦産品級别;采用台積電(TSMC)10nm 制程工藝,半導體總數達 55 億;支援全球最高的通信規格 LTE Cat.18/Cat.13,實作了業界最高的 1.2Gbps 峰值下載下傳速率;同時更新了自行研制的 ISP,并且在前一代雙攝 ISP 的基礎上進行了全面更新,其針對特定場景進行了性能和效果優化,可幫助使用者拍出更自然、更美的照片。在硬體參數的更新之外,Kirin 970 最引人關注的新特性就是全新設計的 HiAI 移動計算平台了。
訓練與推斷
想象一下,如果 AI 是《瘋狂動物城》裡的樹懶「閃電」,這個世界會怎麼樣?答案是 AI 将銷聲匿迹。自 1956 年 AI 誕生以來,三起兩落也罷,百家争鳴也罷,人類始終最希望的是 AI 能夠快速地「學以所用」:不僅要快速地學習知識(訓練),還能快速地應用知識(推斷),讓知識在瞬間爆發出來,這樣 AI 才能為人所用。是以,對知識的及時處理是 Mobile AI 應用的關鍵。
這意味着 Kirin 970 作為手機端 AI 晶片要在知識處理,即推斷上猛抓,且做足功夫,因為全球人工智能的基本趨勢是企業級市場依然是一門「雲生意」,毫無變革念頭;消費級市場則正在從雲端下沉到終端,華為以及蘋果、三星等搶占的正是這塊高地。令人欣慰的是 Kirin 970 在 Mobile AI 方面确實是先聲奪人、先人一步。
那麼,華為如何提供一套兼顧完備性、個性化和隐私保護的知識模型方案呢?
在日常生活中,人類需要個體智慧和集體智慧互相協同産生更巨大的力量;而未來的智慧終端想要不斷地發展,相應的 AI 體系除了要充分發揮終端自身的能力和價值,也要結合大資料和雲技術帶來的海量資訊、服務和超強計算力,如此才能整合通用知識模型與個人知識模型,激發出移動端 AI 在訓練與推斷方面的雙料潛力。是以不會存在純粹終端的 On-Device AI,否則知識模型的完備性将會喪失。
全球化時代背景下,個性化顯得越發珍貴;在手機中,個性化更是提升使用者體驗的重頭戲。一般來講,雲端多以訓練為主,終端多以 Inference 推斷為主,華為的目前這代 NPU 作為一款 AI 加速器則側重加速端側推斷能力。接下來後面如果 NPU 或者 GPU 可以通過個人資料自我訓練,那麼手機就具備了學習能力,它吸取的個人資料越多就越智能,越個性化,越懂我。并真正做到學以所用,而最重要的是這一切發生在本地終端,省去了隐私洩漏的擔憂。
性能與功耗
今年 5 月份谷歌推出
TPU 2.0。TPU 是谷歌研發的一款深度學習加速 ASIC 晶片,第一代 TPU 僅支援推斷(即不可用于訓練模型),并在 AlphaGo 人機大戰中提供了緻勝的算力支撐。目前 TPU 2.0 除推斷以外,還能高效支援訓練環節的深度學習加速。據谷歌披露,32 塊 GPU 并行訓練一整天而完成的深度學習翻譯模型訓練任務,隻需在 TPU2.0 上通過 1/8 TPU Pod(TPU 叢集,每 64 個 TPU 組成一個 Pod)就能在 6 小時内完成。
同樣在今年 5 月,英偉達在 2017 GPU 技術大會(GTC 2017)上正式釋出
新一代處理器架構 Volta V100,「Volta 并不是 Pascal 的更新,而是一個全新的架構!」英偉達應用深度學習研究副總裁 Bryan Catanzaro 如是說。英偉達通過該架構耗資 30 億美元打造了一款深度學習加速器 Tesla V100,其采用台積電(TSMC)12nm FFN 專屬工藝,包含 211 億個半導體,速度超越 100TFlops,英偉達号稱這是全球最先進的資料中心 GPU,主打企業級超大規模深度神經網絡加速。
以上是 2017 年業界對 AI 處理性能探索的兩個典型代表,Tesla V100 與 TPU2 作為伺服器端的 AI 晶片性能無可挑剔,但前提是它們沒有尺寸的考慮和功耗方面的明顯限制,可以一直插着電,并配有先進的降溫系統,這些要求手機端的 AI 晶片顯然無法滿足。大家知道 Kirin 970 含有 55 億個半導體,那麼它們是如何封裝進指甲那麼小的空間呢?并且需要同時保證性能與能耗甚至還有所提升,這一切不能超出手機電池的承受範圍,其難度可想而知。除此之外,Kirin 970(CPU、GPU、NPU、ISP、DSP)還需要考慮實際 APP 的各種需求,難度就更大了。
面對這一問題,華為如何實作從伺服器端到手機端的跨越呢?答案是華為在傳統解決方案 SoC 的深厚積澱之上,創造性地提出了「HiAI 異構架構」,非常好地異構融合了 CPU、GPU、NPU、ISP 與 DSP,在處理同樣 AI 應用任務時,擁有大約 25 倍性能和 50 倍能效優勢,使 Kirin 970 成為了名副其實的全球首款手機端 AI 晶片和 AI 計算平台。
挑戰
Kirin 970 之後,蘋果随後也推出了手機端 AI 晶片 A11,以及搭載該晶片的 iPhone X、iPhone 8、iPhone 8 Plus,後來居上。華為與蘋果在移動端 AI 方面搶占了其他手機廠商如三星、小米的先機,那麼兩家之間孰優孰劣呢?蘋果無疑是 Kirin 970 目前面臨的最大挑戰。
安卓與 iOS
安卓與 iOS 之間的拉鋸戰迎來了新的範式轉換——手機端 AI 晶片。這一次的變革天然有利于蘋果 iOS。一個完整的手機生态需要算力+開發+硬體,三者缺一不可。蘋果軟硬體高度一體化的封閉生态很适合把 A11 晶片的強大算力順利導給開發者,而開發者借助強大算力把想法通過硬體實作出來,進而形成一個良性循環、上下遊多赢的局面,最終帶來收獲口碑的不二王道——絕佳的使用者體驗。
而安卓系統的開放性所帶來的天然缺陷恰恰是無法把 AI 晶片的強大算力從底層順利導向開發和硬體,進而使得算力打折扣。慶幸的是采用安卓系統的華為手機(以及其他國内手機如小米)通過去 GMS 在相當程度上克服了安卓系統的缺陷,這樣華為在手機系統上并未失利,蘋果華為幾乎在同一起跑線上,兩家真正的共同挑戰在于應用場景與共同體驗。從過往的手機體驗以及 iPhone X、iPhone 8、iPhone 8 Plus 的最新表現來看,華為 Mate 10 似乎承受着不小的壓力。
這次的溝通會上,華為給出了一個不正常的對标。通過多張拍照效果對比,華為證明 Kirin 970 在拍照上完爆 iPhone 8 Plus。注意,華為給出的對标是自家的晶片與别家的手機,這顯然不對。其實華為真正想說的是 Kirin 970 要比蘋果 A11 牛,不僅是在拍照效果上,在相同網絡模型下每分鐘識别的圖像數量上也是如此(Kirin 970 為 2005 張,iPhone 8 Plus 為 889 張)。Kirin 970 的 AI 性能優于 A11 是可信的,但這并不意味着華為 Mate 10 的最終性能和使用者體驗同樣優于 iPhone 8 Plus,這才是問題的關鍵。
HiAI 移動計算平台
華為 Mate 10 未出,目前一切皆是「雲測評」。或許隻有等到 Mate 10 出來,答案才能揭曉。但這顯然不是手機端 AI 的最後答卷,兩家都有着先發紅利,把握先機、吸引開發者打造爆款應用才是當務之急。Kirin 970 完爆 A11,固然不錯,但 HiAI 移動計算平台才是當下華為手機的真正利器。
HiAI 移動計算平台推出的最終目的在于把 Kirin 970 的 AI Computing 的能力開放出來,期望更多的 AI 合作夥伴與開發者探索更好的應用。可以說這是大勢所趨,華為别無二擇。Kirin 970 的推出使得華為在移動端 AI 晶片上先發制人,堪稱驚豔,但後續的應用場景同樣關鍵,華為如何做到繼續領先呢?唯有走場景生态的路子,迅速培育出利用 NPU 計算力的殺手級應用,形成商業閉環。HiAI 移動計算平台可謂這次 Kirin 970 溝通會的唯一重頭戲。