本文來自AI新媒體量子位(QbitAI)
日本計算機巨頭NEC宣布,已經開發出一種新的資料處理技術,能加快向量計算機的機器學習速度。這種技術比目前主流的Apache Spark大資料架構快50倍。
NEC表示,新技術利用了一種叫作“稀疏矩陣”的資料結構,能明顯提高機器學習任務中向量計算機的性能。

向量計算機是一種主要用于處理大型科學和工程計算的超級計算機。
上世紀70至90年代,向量計算機架構在超級計算機的發展中占據主導地位。當時,這種架構被用于Cray的大部分平台。然而,由于傳統微處理器設計帶來的強大性能,這種架構逐漸變得不太常見。然而近年來,随着NEC SX系列超級計算機的開發,向量計算機架構正獲得新的生命。
NEC表示,與資料處理技術一同,該公司還開發了新的中間件,通過稀疏矩陣結構去簡化機器學習應用。該公司表示,這種中間件可以從Python和Spark基礎架構中啟動,而不需要額外的程式設計。
對于“快50倍”這種說法,也有質疑的聲音。
Constellation Research副總裁、首席分析師Holger Mueller表示,關于NEC所說的新技術比Apache Spark快50倍,這樣的情況在預料之中,并且這樣比較并不合适。
他指出,Spark通常使用記憶體存儲将資料提供給神經網絡,而神經網絡通常運作在英偉達等公司的GPU上。與此不同,向量計算機針對向量的計算和處理進行了優化,而向量是神經網絡的基礎。
Mueller表示:“毫無疑問,向量計算機在模組化、建立和分析神經網絡過程中速度更快。而英偉達在人工智能和神經網絡領域表現得很好,也是因為該公司的GPU本質上是向量電腦。将Spark存儲和NEC向量計算機結合在一起,進行資料分析、學習和計算的速度會有多快?或許這将帶來最快的速度,但我們需要從NEC的率先嘗試中了解更多資訊。”
與此同時,NEC也強調了新平台的成本經濟性,以及可能的使用場景。
NEC系統平台研究實驗室總經理Yuichi Nakamura表示:“這項技術使使用者可以迅速從機器學習的成果中受益,包括網絡廣告的投放優化、推薦,以及文檔分析。此外,使用少量伺服器的低成本分析将幫助更多使用者獲得大資料分析優勢,而以往這隻屬于大公司。”
NEC還表示,最新的SX-ACE向量計算機能滿足廣泛的性能需求。新的資料處理技術支援大資料分析能力,包括機器學習和深度學習。
NEC宣布,将在奧地利因斯布魯克舉行的2017年“并行和分布式計算國際研讨會”上展示其新技術。
【完】
本文作者:陳桦
原文釋出時間:2017-07-05