AI，能有多快

人工智能（AI）早已滲透到我們生活的各個角落。

它不僅是圍棋、電子遊戲等競技中戰無不勝的最強對手，還正幫助各個領域的科學家解決難題，不僅如此，我們通信軟體裡語音轉文字、一鍵翻譯功能，或者購物網站的智能推薦……它們的背後可能都“躲着”AI。

無論是哪種AI，都離不開強大的計算系統的支援。就好像過去的工業革命首先要有精密測量、原材料和制造方面的重大突破來支援一樣，AI也需要全新的技術來推動。

在這樣一個“AI時代”，來自全球數十家AI領軍機構的計算系統“同台競技”又是一種怎樣的體驗？

這樣的“奧林匹克”真的存在。著名的機器學習開放聯盟MLCommons每年都會組織名為MLPerf的基準測試，它們能夠在AI計算系統的速度和效率等方面給出統一的測量标準，并讓研究人員通過比較各種技術創新，推動最佳創意和解決方案的進步。

今年4月，MLPerf剛剛公布了2022年第一輪推理性能測試（MLPerf Inference V2.0）的結果，讓我們對目前頂尖計算系統的性能有了新的認識。

AI的訓練與推理

MLPerf測試每年有4次，其中包括訓練性能測試和推理性能測試。為了更好地了解這個語境下的“訓練”和“推理”，我們可以先簡單說一說AI的工作原理，它們為什麼如此與衆不同，如此富有魅力。

AI學者賈内爾·沙内（Janelle Shane）在《你看起來好像……我愛你：AI的工作原理以及它為這個世界帶來的稀奇古怪》一書中舉了一個生動的例子：如何訓練AI講笑話。

如果采用傳統程式設計讓計算機講一則笑話，我們就必須把笑話中所有“規則”用程式語言告訴它。無論程式最終變得多麼複雜，本質上仍然是我們為計算機設定好了規則，它去具體地解決這個問題。

但訓練AI截然不同，許多AI專家都認同，和傳統程式設計相比，編寫AI程式更像“教學生”。

用沙内的話說，簡單來講（當然現實情況顯然不會這麼簡單），我們隻要丢給AI一些已有的笑話，用一些基本指令告訴它目标是寫笑話，再加上一大堆随機的字元。“然後，我就去取我的咖啡了。”而AI便開始了工作。

它可能會從瞎猜開始，一次又一次地研究資料集并自我調整，自行摸索出更多規則。當然，某些規則也可能不小心讓它們誤入歧途，比如，曾有一個斯坦福大學的研究團隊嘗試訓練AI來區分健康皮膚和皮膚癌的圖檔，結果最終卻一不小心訓練出了一個尺子測量工具，因為資料集中許多惡性良性腫瘤照片上都有一把用來标度大小的尺子。

但更多時候，在得當的訓練下，AI能發現程式員甚至任何人都不知道的大量規則，建立起屬于自己的“知識體系”。

完成了訓練的AI就像掌握了考點的學霸，它們還有能力将這些所學應用到具體的場景中，根據前所未見的新資料，迅速地給出答案，也就是所謂推理的能力。

這就是AI成為最具吸引力的解決方案的關鍵所在，它具有無窮的潛力和創造力。

然而，整個過程都離不開海量的資料和計算，一切需要在盡可能短的時間内完成。這就對計算系統的性能有了很大的要求。

MLPerf測試就是從訓練和推理這兩個方面入手，對計算性能展開全面的考察。

MLPerf測什麼？

在MLPerf測試中，訓練性能測試相對簡單。它主要分為單機和叢集兩種場景，考察計算系統完成主流AI模型訓練的時間，完成得越快，自然意味着系統性能越強。

但此次公布的推理性能測試則更加全面，設定上也更複雜，它就像體育比賽中的全能比賽或者鐵人三項，更準确地說是“鐵人33項”。推理性能測試針對不同場景，設定了各種名額，考察計算系統完成各類AI任務的速度和能力。它也是以成為行業中的權威标杆之一。

推理性能測試可以首先分為固定任務和開放優化兩大類。其中，固定任務更強調同類比較，像是讓不同的計算系統在同一起跑線上“賽跑”，是以也相對更受重視。

推理性能測試分為固定任務和開放優化兩個類型。（圖／原理）

在固定任務中，為了保證全面性，6大應用場景被囊括其中，每個場景都選取了目前最主流的AI模型作為測試任務。

推理性能測試的6大應用場景。（圖／原理）

這些場景都非常貼近實際應用，和我們的生活息息相關。舉一些最簡單的例子，比如在計算機視覺中，圖像分類是最基本的問題之一。無論是我們在網上檢索圖檔，還是手機相冊幫助我們自動歸類照片，或者對視訊的智能分析時，計算機的基本任務之一就是根據圖像中的資訊将不同圖檔區分開來。

而對計算機和人類的互動而言，語言模型是根本。能夠了解人類語言的NLP（自然語言處理）可以應用在翻譯、問答、文本生成等各個方面，各類智能助手都離不開它。

除此之外，應用場景中還囊括了一些更專業的方向，比如生物醫學圖像分割。我們在醫院拍攝的CT、MRI這些醫學影像和普通的照片不太一樣，它們很多時候是“塊狀”的，也就是說，一整張圖由很多個切片構成，這也給圖像處理帶來了額外的挑戰。生物醫學圖像分割就是對這些醫學影像中器官或病變進行分割，進而更精準地識别和分析，這也是計算機輔助醫療中的關鍵一步。

針對這些應用場景，測試設定了不同考察次元。可以這麼了解，這其實就是進一步将應用場景細化，創造出更豐富的貼合實際的情境，進而全方位地檢驗計算系統在各種可能發生的情況下的表現。

針對不同模型，測試還設定了不同考察次元，包括資料中心和邊緣中的不同場景。（圖／原理）

新的紀錄，新的未來

這次MLPerf推理性能測試共有19家機構參與，總計超過千項資料被送出。

其中，浪潮AI伺服器在總共33項任務中，斬獲了27項冠軍，其中包括資料中心全部16項冠軍，以及邊緣17個單項中的11項冠軍，在各項任務中創下了新的AI推理速度紀錄。

浪潮AI伺服器在本次MLPerf推理性能測試（資料中心離線場景）中創造的各項紀錄。（圖／原理）

這代表着目前最先進的AI計算水準。随着AI應用在各個行業中的持續深化，更快的推理速度将帶來更高的AI應用效率和能力，加速産業智能化轉型。

相比前一次的測試結果，浪潮AI伺服器将圖像分類、語音識别和自然語言處理任務的推理性能分别提升了31.5%、28.5%和21.3%，換句話說，系統在自動駕駛、語音會議、智能問答和智慧醫療等各類場景中，都有能力更高效、快速地完成各項智能任務。

在強大算力的驅動下，數字技術會在實體世界得到更深度的應用。将來，我們或許都有機會駕駛着高度自動化的汽車，在智能交通系統的幫助下，用最快捷、最安全的方式到達想去的地方。隻要對着智能助手說兩句話，我們下單的用品就能在最短時間内即刻送達。有了語音實時識别和翻譯，語言的壁壘也逐漸消融，我們有了更多溝通交流的機會，認識更廣闊的的世界。

正如浪潮資訊所言，智慧時代，計算力就是生産力，智算力就是創新力。它将成為推動新一輪科技革命和産業變革的重要力量。

#創作團隊：

撰文：Takeko

排版／設計：雯雯

#參考來源：

https://mlcommons.org/en/

https://mlcommons.org/en/news/mlperf-inference-1q2022/

[美] 賈内爾·沙内，《你看起來好像……我愛你：AI的工作原理以及它為這個世界帶來的稀奇古怪》，中信出版·鹦鹉螺，2021年4月

測試結果相關資料由浪潮資訊提供。

#圖檔來源：

封面圖：原理

首圖：Mike MacKenzie, Flickr, CC BY

*本次推送由浪潮資訊贊助。

AI，能有多快

繼續閱讀

人工智能帶來育兒焦慮，澳洲華人家長為子女的未來憂愁

OpenAI o1與人工智能的過去與未來

未來不會被人工智能取代的4個領域，第1個最穩，第4個成本效益最高

Adobe的Project Turntable人工智能工具可在三維空間中旋轉二維藝術作品

陳健淋｜通用人工智能視野下企業資料賦權的類型展開

科學家利用新型人工智能揭開嬰兒學習和發育的秘密

南沙和華為強強聯手！共建人工智能生态基地

2025年人工智能十大趨勢！最新預測→

張藝謀透露《三體》進度：隻拍一部、大幅删改、引入人工智能

法蘭克福書展聚焦人工智能發展與監管

人工智能未來十大趨勢

研學報道|“探索科技前沿引領未來創新”人工智能創新應用博覽會研學之旅啟航

論壇直擊|人工智能創新應用發展領航交流會圓滿舉辦

數字科技、人工智能拯救春晚收視率

DeepSeek出世，人工智能厲害，教師會被取代嗎？讀書還有意義嗎？

一邊大量失業一邊搞人工智能，發展搶了幾億人飯碗，未來怎麼辦？