天天看點

解析聯想人工智能實踐

古人雲,“工欲善其事,必先利其器”。

不久前,谷歌AlphaGo2代3:0擊敗圍棋世界冠軍柯潔後,宣布未來焦點将從圍棋轉向行業應用領域,其實也宣布了人工智能(AI)開始成為企業計算解決方案提供商的下一個重點領域。

衆所周知,人工智能領域的三大基礎是計算、算法和資料。資料角度,各種手持終端包括物聯網傳感器的廣泛使用,使得資料量呈幾何級數增長态勢;在算法層面,AlphaGo 2代以政策網絡和深度學習、增強學習算法疊加的技術日臻成熟。這時候,針對AI在計算力上面的開發,就成為了重點——所謂“工欲善其事,必先利其器”。

“聯想是包括BAT,百度,阿裡,騰訊在内的衆多網際網路企業的AI GPU伺服器的主要供應商。”在2017聯想全球超算峰會上,聯想集團進階副總裁、資料中心業務集團中國區總經理童夫堯舉了個例子,“比如,在京東,聯想優化GPU架構後的5000個計算節點,正在被用于京東深度學習等應用。利用它進行的消費者購買習慣分析等算法,這套系統現在已經廣泛服務于京東6000萬客戶。”

解析聯想人工智能實踐

聯想集團進階副總裁、資料中心業務集團中國區總經理童夫堯

AI GPU伺服器是個啥

為什麼AI總是和GPU挂鈎?據聯想集團副總裁、企業服務雲計算研究室、無線研究實驗室黃瑩博士介紹,谷歌做翻譯訓練的時候,一般的訓練要在12台帶8個GPU的機器上算一周。

實際上,AI和GPU挂鈎是因為AI等類類神經網路的處理更多會牽涉到矩陣乘法和加法,使用并行運作的GPU效率較高且成本較低,是目前主流的計算引擎,比如NVidia的P100、V100,但缺點是耗能較高;而内建DSP區塊和本地存儲器的FPGA可獲得較佳的能源效率,但價格比較昂貴;CPU則更多用于控制和參數同步,目前專門用于機器學習的Intel Phi在奮起直追。

如果用GPU進行深度學習訓練,很重要的一點就是如何來做好并行化,與AI算法相比對,是以優化設計GPU叢集是目前的重點之一。聯想的方法是,在NV GPU主力引擎配合CPU、Phi、PFGA各種處理器之上做一層高效任務排程軟體,調用各種不同的主流深度學習架構如谷歌的TensorFlow、Facebook的Caffe、微軟的MXNET以及torch、theano等,進行更快速的并行化處理,達到更高效運作的目的,來支援基于深度學習的各種人工智能應用。

解析聯想人工智能實踐

多元技術人才儲備

這樣的多伺服器、多GPU的中大型規模訓練,需要人工智能專家在深度學習模型和設定架構方面,網絡系統工程師和存儲系統工程師在分布式存儲和網絡設定方面,分布式計算專家在模型平行化方面通過協同工作來設定模型,進行訓練。

而聯想在人才儲備方面具備很好的優勢,包括從微軟亞洲研究院常務副院長位置上加盟聯想的芮勇博士等,使得聯想從基礎架構、計算力到算法到資料的積澱,都具備了真正的AI研發實力和核心競争力。

據黃瑩博士介紹,目前業界比較領先的GPU叢集,性能可以達到理論峰值的90%左右,而聯想的GPU叢集能夠達到97%,而且可以支援大規模叢集,這相當于可以帶領使用者更快速地進入到AI的環境中。

實際上,聯想也是以成為BAT等網際網路企業的AI GPU伺服器的主要供應商。

解析聯想人工智能實踐

聯想集團副總裁、企業服務雲計算研究室、無線研究實驗室黃瑩博士

聯想AI應用探索

據介紹,聯想目前在AI方面已經做了的一些嘗試和探索,包括京東、淘寶、微網誌、亞馬遜上的評論等自然語言,采集回來進行了解處理,可以達到90%以上的準确率。

而聯想的AI還應用于自家的電腦、手機零售門店系統,譬如在門店裡采集到的圖像資料,通過深度學習,可以看到人們在店面環境中最喜歡通路的區域在哪個區域,路線如何進行優化,進而更好地服務顧客。

另外,在智慧醫療方面,聯想也已經和國内的一些大型醫院合作,比如醫生在拿到CT圖像以後,可以通過聯想的深度學習一體系統來輔助判斷,哪些圖像可能會是早期癌症病人,接下來要做哪些工作。

所謂聯想的深度學習一體系統,其實就是把多機分布式訓練變得像單GPU一樣簡單。但其背後,是聯想對深度學習一體系統在性能方面的多節點并行訓練,使得模型訓練時間成倍縮短,加速比達到87%,同時支援大規模叢集。

解析聯想人工智能實踐

ABCD理論實踐

在聯想看來,人工智能成功要素主要有四個,可以歸納為ABCD。A就是Algorithms算法,B就是Business商業,C就是Computing Power計算力,而D則是Data資料。

對于聯想來說,在算法方面,聯想的自然語言了解可達90%以上的準确率,在視訊分析方面也已經成功用于自身的門店智能化管理;在商業方面,聯想在行業領域已經成功進行了很多合作,包括醫療領域的溫州第一醫院,制造業的寶鋼集團,教育領域的貴陽理工等等;在計算力方面,聯想具備整套的HPC高性能計算方案和人工智能軟硬一體系統;最後在資料方面,聯想自研了Ceph分布式存儲和大資料平台LEAP,可以處理12PB以上規模的資料量。

不僅如此,聯想還在2017聯想全球超算峰會上宣布推出新一代自主研發、并擁有多項AI關鍵技術的HPC解決方案深騰8810,包括搭載的超算平台LiCO內建了深度學習應用,以及Tensorflow,Caffe,MXNET等AI架構,涉及資料預處理,訓練,參數調整,過程監控等解決方案。

解析聯想人工智能實踐

而在生态層面,聯想除了在硬體領域加強與英特爾,英偉達,Mellanox等廠商的合作,還會在軟體領域開放生态系統,并且會投資一些科技創新公司,包括Face++等。

這些,都将在即将成立的聯想位于中國北京、美國莫裡斯維爾和德國斯圖加特的全球三大AI創新中心中,與行業生态夥伴進一步合作,幫助人工智能在各行各業的應用普及。

在筆者看來,聯想目前已經在人工智能領域加快布局——除了已有的高性能計算商用領域的優勢外,還在相關AI人才的積累方面投入了巨大的研發資源,同時通過全球創新中心的生态建設,來幫助行業客戶形成更接地氣的場景化人工智能落地應用,進而形成AI領域的基礎架構優勢地位。

繼續閱讀