解析聯想人工智能實踐

古人雲，“工欲善其事，必先利其器”。

不久前，谷歌AlphaGo2代3:0擊敗圍棋世界冠軍柯潔後，宣布未來焦點将從圍棋轉向行業應用領域，其實也宣布了人工智能（AI）開始成為企業計算解決方案提供商的下一個重點領域。

衆所周知，人工智能領域的三大基礎是計算、算法和資料。資料角度，各種手持終端包括物聯網傳感器的廣泛使用，使得資料量呈幾何級數增長态勢；在算法層面，AlphaGo 2代以政策網絡和深度學習、增強學習算法疊加的技術日臻成熟。這時候，針對AI在計算力上面的開發，就成為了重點——所謂“工欲善其事，必先利其器”。

“聯想是包括BAT，百度，阿裡，騰訊在内的衆多網際網路企業的AI GPU伺服器的主要供應商。”在2017聯想全球超算峰會上，聯想集團進階副總裁、資料中心業務集團中國區總經理童夫堯舉了個例子，“比如，在京東，聯想優化GPU架構後的5000個計算節點，正在被用于京東深度學習等應用。利用它進行的消費者購買習慣分析等算法，這套系統現在已經廣泛服務于京東6000萬客戶。”

聯想集團進階副總裁、資料中心業務集團中國區總經理童夫堯

AI GPU伺服器是個啥

為什麼AI總是和GPU挂鈎？據聯想集團副總裁、企業服務雲計算研究室、無線研究實驗室黃瑩博士介紹，谷歌做翻譯訓練的時候，一般的訓練要在12台帶8個GPU的機器上算一周。

實際上，AI和GPU挂鈎是因為AI等類類神經網路的處理更多會牽涉到矩陣乘法和加法，使用并行運作的GPU效率較高且成本較低，是目前主流的計算引擎，比如NVidia的P100、V100，但缺點是耗能較高；而内建DSP區塊和本地存儲器的FPGA可獲得較佳的能源效率，但價格比較昂貴；CPU則更多用于控制和參數同步，目前專門用于機器學習的Intel Phi在奮起直追。

如果用GPU進行深度學習訓練，很重要的一點就是如何來做好并行化，與AI算法相比對，是以優化設計GPU叢集是目前的重點之一。聯想的方法是，在NV GPU主力引擎配合CPU、Phi、PFGA各種處理器之上做一層高效任務排程軟體，調用各種不同的主流深度學習架構如谷歌的TensorFlow、Facebook的Caffe、微軟的MXNET以及torch、theano等，進行更快速的并行化處理，達到更高效運作的目的，來支援基于深度學習的各種人工智能應用。

多元技術人才儲備

這樣的多伺服器、多GPU的中大型規模訓練，需要人工智能專家在深度學習模型和設定架構方面，網絡系統工程師和存儲系統工程師在分布式存儲和網絡設定方面，分布式計算專家在模型平行化方面通過協同工作來設定模型，進行訓練。

而聯想在人才儲備方面具備很好的優勢，包括從微軟亞洲研究院常務副院長位置上加盟聯想的芮勇博士等，使得聯想從基礎架構、計算力到算法到資料的積澱，都具備了真正的AI研發實力和核心競争力。

據黃瑩博士介紹，目前業界比較領先的GPU叢集，性能可以達到理論峰值的90%左右，而聯想的GPU叢集能夠達到97%，而且可以支援大規模叢集，這相當于可以帶領使用者更快速地進入到AI的環境中。

實際上，聯想也是以成為BAT等網際網路企業的AI GPU伺服器的主要供應商。

聯想集團副總裁、企業服務雲計算研究室、無線研究實驗室黃瑩博士

聯想AI應用探索

據介紹，聯想目前在AI方面已經做了的一些嘗試和探索，包括京東、淘寶、微網誌、亞馬遜上的評論等自然語言，采集回來進行了解處理，可以達到90%以上的準确率。

而聯想的AI還應用于自家的電腦、手機零售門店系統，譬如在門店裡采集到的圖像資料，通過深度學習，可以看到人們在店面環境中最喜歡通路的區域在哪個區域，路線如何進行優化，進而更好地服務顧客。

另外，在智慧醫療方面，聯想也已經和國内的一些大型醫院合作，比如醫生在拿到CT圖像以後，可以通過聯想的深度學習一體系統來輔助判斷，哪些圖像可能會是早期癌症病人，接下來要做哪些工作。

所謂聯想的深度學習一體系統，其實就是把多機分布式訓練變得像單GPU一樣簡單。但其背後，是聯想對深度學習一體系統在性能方面的多節點并行訓練，使得模型訓練時間成倍縮短，加速比達到87%，同時支援大規模叢集。

ABCD理論實踐

在聯想看來，人工智能成功要素主要有四個，可以歸納為ABCD。A就是Algorithms算法，B就是Business商業，C就是Computing Power計算力，而D則是Data資料。

對于聯想來說，在算法方面，聯想的自然語言了解可達90%以上的準确率，在視訊分析方面也已經成功用于自身的門店智能化管理；在商業方面，聯想在行業領域已經成功進行了很多合作，包括醫療領域的溫州第一醫院，制造業的寶鋼集團，教育領域的貴陽理工等等；在計算力方面，聯想具備整套的HPC高性能計算方案和人工智能軟硬一體系統；最後在資料方面，聯想自研了Ceph分布式存儲和大資料平台LEAP，可以處理12PB以上規模的資料量。

不僅如此，聯想還在2017聯想全球超算峰會上宣布推出新一代自主研發、并擁有多項AI關鍵技術的HPC解決方案深騰8810，包括搭載的超算平台LiCO內建了深度學習應用，以及Tensorflow，Caffe，MXNET等AI架構，涉及資料預處理，訓練，參數調整，過程監控等解決方案。

而在生态層面，聯想除了在硬體領域加強與英特爾，英偉達，Mellanox等廠商的合作，還會在軟體領域開放生态系統，并且會投資一些科技創新公司，包括Face++等。

這些，都将在即将成立的聯想位于中國北京、美國莫裡斯維爾和德國斯圖加特的全球三大AI創新中心中，與行業生态夥伴進一步合作，幫助人工智能在各行各業的應用普及。

在筆者看來，聯想目前已經在人工智能領域加快布局——除了已有的高性能計算商用領域的優勢外，還在相關AI人才的積累方面投入了巨大的研發資源，同時通過全球創新中心的生态建設，來幫助行業客戶形成更接地氣的場景化人工智能落地應用，進而形成AI領域的基礎架構優勢地位。

解析聯想人工智能實踐

繼續閱讀

【趨高機器視覺】機器視覺技術原了解析及解決方案

雲計算面試題及答案，雲計算主要就業崗位

雲計算面試題——mysql/存儲引擎/備份

雲計算面試題——檔案/權限/分區/軟體包管理

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希