資料中心加速，一文說清FPGA與GPU、ASIC目前的競争格局

超大規模雲計算中心、電子商務和社交網絡資料中心，正面臨着資料類型複雜的工作負載加速之難題。

資料中心加速的主要途徑

傳統CPU處理能力的需要突破已經成為共識，目前的途徑主要有以下幾類：

途徑一，ASIC：經曆了幾十年的發展演變，為專門目的而設計的ASIC，由于面向特定使用者的需求，在加速效率上可圈可點。但是，設計周期長、成本貴、應用範圍窄的通病，使ASIC僅适合于批量很大或者對産品成本不計較的場合。

途徑二，GPU：随着近年來機器學習等領域的突飛猛進，GPU也早已經不再局限于3D圖形處理，其在浮點運算、并行計算等部分計算方面的特性已經引起業界越來越多的關注，尤其是目前最大的獨立晶片生産銷售商NVIDIA有些如日中天的感覺，但其在應用廣度上的通用性仍然有待時間的檢驗。

途徑三，FPGA：它作為半定制的ASIC而出現，既解決了定制電路的不足，又在性能與應用廣度上顯示出優勢，英特爾已經積極布局，推出CPU+FPGA架構，賽靈思池化FPGA近期取得的一些新成果，也使FPGA進入資料中心加速的主角地位。

賽靈思資料中心加速器取得重大進展

日前，賽靈思在2016全球超算大會（SC 16）上宣布推出一套全新的技術——賽靈思可重配置加速堆棧方案，旨在幫助全球最大的雲服務供應商快速開發和部署加速平台。通過賽靈思FPGA，該方案比x86伺服器CPU提高40倍；比競争型FPGA方案提高了6倍。

賽靈思全球戰略進階副總裁Steve Glaser和雲戰略總監Andy walsh對賽靈思最新的FPGA動态可重配置堆棧技術進行了詳細的介紹。

超大規模工作負載中，賽靈思FPGA的機關功耗性能與CPU對比

與伺服器CPU的性能對比，機關功耗性能在機器學習推斷方面提高了11倍；資料分析SQL查詢方面提升了33倍；視訊處理轉碼提高40倍；存儲壓縮提高40倍；網絡vSwitch可提高23倍。

在以計算效率和加速器使用率所組成的象限中，賽靈思池化FPGA的機關功耗性能實作了比Altera FPGA高2-6倍，相關産品将在明年上市。

資料中心加速主要途徑比較

問題一：賽靈思FPGA VS. 英特爾內建式MCM CPU+FPGA

賽靈思全球戰略進階副總裁Steve Glaser認為，在代表應用廣度的橫軸和加速器使用率的縱軸所組成的象限圖中，賽靈思池化FPGA在超大規模網絡應用方面已經遙遙領先；英特爾注意到FPGA的優勢，但其內建式MCM CPU+FPGA目前隻能解決中小企業的問題。

問題二：賽靈思FPGA VS. 英偉達GPU

面對日益火爆的GPU，Steve指出，GPU和定制ASIC在應用廣度方面與FPGA相比遠遠不足；

以機器學習加速為例，使用神經網絡分類圖像、翻譯文本和語音、識别無結構資料中的底層模式，需要“兩階段”法。

第一階段（教育訓練），使用海量加标記的樣本資料和計算教育訓練神經網絡，英偉達GPU擅長的這一領域隻占機器學習5%的市場規模。

一旦網絡教育訓練完成，便進入第二個階段（推斷），通過受訓的神經網絡處理新資料樣本或查詢，以确定其可能的級别。這一占機器學習加速90%的市場正是賽靈思FPGA角逐的天下。

推斷是當今最大規模資料中心中的一個巨大的工作負載，因為它負責實作廣泛的日益擴充的重要應用，例如語言翻譯、自然語言接口、照片和視訊内容識别，以及網上産品選擇與促銷。其中兩個最大的人工智能市場分别是無人駕駛汽車和機器人。

而賽靈思池化FPGA将機器學習推斷計算效率提升了2-6倍。

近年來賽靈思在加速領域的裡程碑事件回顧

回顧一下賽靈思在雲計算加速領域的重要裡程碑事件：

賽靈思近年來在加速領域的裡程碑事件

2014~2015年，賽靈思與高通、IBM等公司展開合作，并在業界推出首款20納米和16納米資料中心産品，比競争對手提前了1年又1個季度。此外，賽靈思還積極推動制定行業标準的CCIX聯盟的發展。

目前，全球七大超大規模雲服務公司中，已有3家采用了賽靈思FPGA，其中：

百度采用了賽靈思技術作為資料中心的池化資源部署，以及用于無人汽車和語音的機器學習；前不久，百度宣布利用賽靈思技術使序列分析提升了10倍。

微軟宣布，為實作伺服器上的網絡加速，其資料中心已經大規模部署賽靈思FPGA技術搭建加速器架構，以配置設定越來越高的工作負載。

亞馬遜不久前公布在彈性計算雲上實作了FPGA即服務。保險定價公司AON、基因序列測試公司edico genome、機器學習公司TERADEEP等亞馬遜合作夥伴都已經宣布采用了AWS F1執行個體。

初創型技術公司也是賽靈思重要的使用者類型之一。

DEEPHI TECH是一家初創公司，攜手賽靈思推出用于機器學習推斷的FPGA平台，以及用于部署的超高效神經網絡，與GPU相比效能甚至提高了10倍。

使用賽靈思FPGA的單個伺服器與整個機架的CPU性能對比

可重配置加速堆棧：行業标準的開發與部署

随着網際網路和物聯網的大規模應用，未來很多工作負載将是今天的我們所無法想象的。

行業标準的開發與部署

賽靈思雲戰略總監Andy walsh介紹，賽靈思可重配置加速堆棧的第一層平台開發版在不久前已經推出，主要用于超大規模資料中心部署，以及基于雲的開發環境。

在中間的應用開發層，賽靈思提供了內建架構；用于機器學習、分析和視訊的應用函數庫；以及針對UltraScale FPGA優化的數學函數庫。

在上層，賽靈思對OpenStack提供了支援，可進行雲配置與管理；支援UltrascaleFPGA；2017年将推出Ocata 版。

賽靈思加速堆棧

“如果您是一家主攻機器學習推斷的公司，賽靈思池化FPGA是最佳的選擇。”Andy說。

點評：

資料中心加速，一文說清FPGA與GPU、ASIC目前的競争格局

繼續閱讀

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

分類算法的評價名額

K-近鄰算法以及圖像分類應用

weka之NB算法

使用weka的select attribute

weka中分類器算法

在weka中內建自己的算法

【多變量線性回歸】學習記錄序思路實作終

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

解讀2008年網絡技術熱詞之雲計算

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告