阿裡雲釋出異構計算平台，隻是為了人工智能嗎？

大約三個月前，一個朋友找到我，托我找找認識的管道采購上萬片AMD顯示卡。我詢了一圈總代，得到的答複竟然是高性能AMD顯示卡全國斷貨！

衆所周知，GPU是人工智能AI伺服器的核心元件，因為深度學習、推理所需要的複雜計算，可以充分發揮GPU上千個計算單元并行計算的能力，降低成本、提高效率。或許，是人工智能大熱，導緻高性能顯示卡全國斷貨？

實際上，2017年7月，國務院印發《新一代人工智能發展規劃》，人工智能從行業方向層面被提至國家戰略層面。

整個産業都在思考，我們應該做什麼？怎麼做？

從珠穆朗瑪到青藏高原

9月12日，阿裡雲宣布推出全新一代異構計算加速平台，在業界第一次覆寫了包括AMD、NVidia的GPU和Intel、XILINX的FPGA在内的所有6款主流異構執行個體。

公有雲服務商更新計算産品并不奇怪，何況如今人工智能大熱，國家鼓勵新舊動能轉換，鼓勵産業更新。

以往，人工智能這樣的複雜應用計算通常需要高性能計算（HPC）伺服器，甚至提供叢集計算服務的超算中心來完成。特别是HPC産業也已經開發并推出了越來越多的GPU異構HPC來滿足AI市場需求。

但問題在于，傳統超算中心的使用門檻比較高，而自購高性能計算軟硬體，對于很多人工智能初創企業來說，也不現實。從這一角度，即便是傳統超算中心，也已經把雲化高性能計算叢集，特别是雲化異構HPC滿足更廣泛的市場需求提上了議事日程。

不過，傳統超算中心的雲化過程必然是漫長的，因為傳統市場的保有量必然會延緩其轉型的緊迫性。相對而言，阿裡雲這樣的雲服務商提供包括E-HPC全新高性能計算執行個體在内的阿裡雲異構計算家族和平台，相當于開拓一片全新的市場，自然能動性要高很多。

這裡引用一段阿裡雲高性能計算研發負責人何萬青博士的話：“如果把傳統超算中心比作‘珠穆朗瑪峰’，那麼阿裡雲的E-HPC則是将高性能計算做更普惠的覆寫，成為高性能計算的‘青藏高原’。”

建構生态優勢

其實，青藏高原和珠穆朗瑪峰的差別，就在于面和點的差別。雲計算相對于傳統架構，最大的優勢在于降低了計算門檻——不僅是使用者的門檻，還有開發者、ISV的門檻。而由此而形成生态之後，能量甚至會成幾何倍數放大。

從這一角度，阿裡雲推出全新一代異構加速平台，必然不是為了和傳統超算中心搶奪客戶。在筆者的求證下，阿裡雲異構計算負責人張獻濤介紹，異構加速平台的生态實際上有兩個層面：一是圖形計算、生命科學、材料力學、分子動力學等科研計算領域以及其他各行各業的ISV，讓異構高性能計算得以普及；另一層面就是人工智能創業企業，而阿裡雲正在制定相關的扶持計劃，為符合條件的人工智能初創企業提供高達百萬元的資金輔助。

阿裡雲釋出異構計算平台，隻是為了人工智能嗎？

從左至右：龍欣、張獻濤、何萬青與媒體溝通

由此，我們可以回到一個業界一再思索的問題：為什麼人工智能概念已經提出了60多年，直到最近人工智能市場才得以引爆呢？在筆者看來，答案很簡單，因為雲計算時代來臨了。

衆所周知，人工智能有三大要素：資料、計算力、算法。資料，得益于智能終端和傳感器的普及，以及更為重要的背景雲資料中心和雲計算服務商大幅降低計算、存儲成本，形成爆發式增長；算法方面，即便是今天談的最多的深度學習、神經網絡的算法，實際上在30年前就已經出現了，無論是科學家還是工程技術人員都在算法層面做了大量研究。

隻有計算力，作為降低深度學習模型訓練時間成本的關鍵，才恰恰是鑽木取火、點燃人工智能火堆的最關鍵的那一根火絨草。無論是計算力還是資料的爆發增長，都得益于雲計算。是以，在筆者看來，從平台到生态，雲計算一定是人工智能未來發展的基石。

異構計算各不相同

回到技術層面，所謂“異構計算”到底為什麼對人工智能如此關鍵？

在筆者看來，異構計算并不是什麼新概念，因為我們的電腦早就在采用CPU和GPU兩種不同架構的處理器，來加速完成大規模圖形渲染這樣的需求了。

實際上，GPU和AI關聯起來，主要是因為AI等類神經網路的處理更多會牽涉到矩陣乘法和加法——這與GPU采用了上千個計算單元并行處理的架構以滿足圖形渲染的處理需求更為類似，因而使用GPU處理AI的效率較高且成本較低。

GPU最多可以提供5120個計算單元，而CPU最高的并行處理也隻有32核，事實上，CPU更多用于控制和參數同步。因而兩者配合使用，能達到AI計算最優的效果。

但GPU也不是所有異構計算的完美解決方案，因為GPU的能耗比較高，比如NVidia的P100、V100等主流AI用GPU，都面臨這樣的問題，在大規模叢集計算的時候，尤為明顯。是以，内建DSP區塊和本地存儲器的FPGA由于可獲得較佳的能源效率，也是異構計算替代方案之一，但缺點是目前FPGA晶片的價格還比較昂貴。

值得一提的是，異構計算中GPU或FPGA的差別還不僅僅展現在能耗和價格上面。舉個例子，相比GPU和CPU，FPGA因為其可程式設計特性，更适合非标資料位寬的人工智能、金融分析、基因比對、物聯網資料庫等領域。阿裡雲異構産品研發負責人龍欣介紹，阿裡雲針對非标準位寬場景做了大幅優化，以物聯網時序資料庫為例，采用XILINX KU115*2 PFGA晶片的阿裡雲F2的處理效率可比CPU高30倍，為使用者大幅降低硬體加速時間和成本。

而采用了NVidia Pascal架構P4圖形處理器的GPU執行個體GN5i，提供最大45Tops INT8整型計算能力和11TFlops FP32單精度浮點計算能力，适用于深度學習線上推理（Inference）。在雲計算架構下，使用者可根據深度學習計算力的要求，進行GPU執行個體的“Scale-out”水準擴容或“Scale-up”垂直變配，分鐘級即可完成執行個體的建立，包括一鍵部署TensorFlow、Caffe等主流深度學習架構，提供智能排程、自動運維、實時擴容等服務，經過測算，可有效降低人工智能線上服務成本50%以上。而基于AMD S7150*4 GPU的GA1異構計算産品，則主要面向高性能圖形計算的需求。

無論如何，《新一代人工智能發展規劃》中明确的，到2020年我國整個人工智能核心産業規模要超過1500億元，總體技術和應用要與世界先進水準同步的要求，會因為阿裡雲的全新一代異構加速平台，而變得更加靠譜。

畢竟，新的平台和生态，代表了這個世界新的生産關系和活躍進取的人與企業。我們，需要新舊動能的轉換來提高生産力，不是嗎？

阿裡雲釋出異構計算平台，隻是為了人工智能嗎？

繼續閱讀

【趨高機器視覺】機器視覺技術原了解析及解決方案

雲計算面試題及答案，雲計算主要就業崗位

雲計算面試題——mysql/存儲引擎/備份

雲計算面試題——檔案/權限/分區/軟體包管理

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希