天天看點

平庸向左,黃仁勳向右

1.

創立一家公司很容易,保持一家公司活着很難。

為了讓曾經多次處在存亡之際的英偉達能夠活下去,聯合創始人兼 CEO 黃仁勳 (Jensen Huang) 在過去的29年裡曾經做出許多在當時極具風險的決定。

神奇的是,這些決定當中的絕大多數,最後竟然都被證明是正确的:從 TNT,到可程式設計 Shader(着色器),再到 CUDA 架構以及其開源和前向相容,以及總是超過目前圖形市場主流應用場景需求的算力和存儲性能水準——這些關鍵的技術和産品,以及革新性的戰略決策,一次又一次将英偉達在計算市場的地位推至新高。

在營銷政策助推下,今天的人們尊稱黃仁勳為“AI教父”,誇張地将英偉達的圖形計算産品描述為“核彈”。然而實際上,黃仁勳并沒有什麼封神的幻想——他做出的很多決定,完全是為了避免自己最害怕的事情發生:

英偉達淪為一家平庸的個人電腦零部件供應商。

“螢幕上就有那麼多像素,晶片上能加的功能就那麼多,但半導體的數量還在不斷增加。這樣下去,在某個時間點上,圖形計算性能完全可以足夠任何人使用。你看今天各種內建顯示卡,性能又好,又不要錢,就會發現這個分析是完全正确的,”

“那麼,如果我們不重新發明電腦圖形計算,不革自己的命,不徹底解放這塊圖形處理器的能力的話,結局就是英偉達必然會被商品化 (commoditized)。”

——黃仁勳,via Stratechery

帶着這樣的恐懼,黃仁勳走上了一條自己革自己命的創業路。這條路,走到今天,已将近三十年。

2.

最近,英偉達召開了年度技術大會 GTC 2022,釋出了最新一代商用級 H100 GPU,和以知名計算機科學家 Grace Hopper 命名的 Hopper 架構。新架構采用台積電4納米制程工藝,記憶體帶寬達到每秒3TB,在32和64位浮點計算上相比前一代 Ampere 架構的 A100 GPU 快了三倍。

H100 已經成為最新一代“核彈”,但英偉達還有更多殺手锏:

通過最新的互聯技術 NVLink 技術,8張H100單卡連接配接構成了的 DGX H100 模組化超級計算機,算力達到了驚人的 1EFlops;而 NVLink Switch 技術在擴充性上也獲得了史詩級提升,支援最多256張 H100 GPU 互聯。

由于 GPU 進行深度學習計算需要大量的記憶體帶寬,英偉達甚至和 ARM 合作開發了一款采用全新 Grace 架構的 CPU,專門用來輔助 GPU 進行帶寬配置設定,進而讓 GPU 可以全力開動進行計算,不會因為在記憶體帶寬上受到限制而影響發揮。

平庸向左,黃仁勳向右

早已在深度學習計算方面身位領先的英偉達,再一次打造了新的 GPU、CPU 架構、互聯技術。今天這家公司早已不再是單純的顯示卡技術公司——它已經将圖形加速計算的功力推到極限,為深度學習計算帶來了新的可能性。

在 GTC 大會上,黃仁勳認為人類将會迎來 AI 被 AI(而不隻是人類)所創造出來的時代,并将其稱為“生産智能”(intelligence manufacturing)。

會後,黃仁勳接受了 Stratechery 部落客筆/知名分析師 Ben Thompson 的采訪。特别的是,黃仁勳在這次采訪中談到了一些過去鮮少讨論的話題——特别是對于公司平庸化的恐懼,以及英偉達三十年的創業路走到今天的感悟。

在他看來,沒有比讓英偉達變成 “Wintel” 生态下的一家普通供應商更可怕的事情了。

2009年,黃仁勳在斯坦福大學做了一場名為“Vision Matters”的演講。其中,他回憶起了公司在2000年推出可程式設計像素着色器(programmable pixel shader, 以下簡稱可程式設計 shader),在當時差點要了公司的命。

但是如果沒做那個決定,英偉達可能就不會獲得今天的行業地位。

作為獨立圖形處理器概念的主要推手,英偉達拿着紅衫等投資者的2000多萬美元苦心研發 GPU 技術,雖然頭兩款産品 NV1、NV2 GPU 都遭遇了失敗,還好 NV3(正式命名為 RIVA 128)由于技術相對先進、價格低廉,推出不到1年就實作了100萬枚出貨量。在 RIVA 128 打下的基礎上,英偉達又在次年推出了 RIVA TNT,性能顯著優于當時的競争對手 3dfx 的産品,成功攬下當時多家顯示卡廠商加入其陣營。

RIVA 128 和 TNT 的優秀戰績,助推英偉達在1999年成功上市,然而當時的黃仁勳已經不再看好這兩款産品所代表的技術理念了。

早年的 GPU 産品,包括 RIVA TNT 在内,都屬于固定功能的晶片。這類晶片的優勢就是運作固定功能的效率很高。

然而在黃仁勳看到的未來裡,提升 GPU 的純粹性能将變得毫無意義。因為螢幕上的像素總量是有限的,一個處理器裡能放進去的既有功能也是有限的。結果就是,總有一天人們将會滿足于現有 GPU 的性能,不再需要更新更快的 GPU……屆時,英偉達将會淪為一家平庸的 PC 零部件供應商。

于是,黃仁勳開始了英偉達的第一次“離經叛道”:推出了可程式設計 shader。

英偉達這樣做的背後理念,就是改變 GPU 作為固定功能處理器的身份,将它變成一個可程式設計的處理器,讓使用者可以在英偉達 GPU 上做更多創意工作,包括3D渲染、特效制作、遊戲開發等——這樣,英偉達 GPU 的使用者将不僅僅是普通消費者,也将包括開發者。

平庸向左,黃仁勳向右

3.

這次轉型差點要了英偉達的命,不是因為這個方向錯了——它是正确的,隻是發生得太早了。

前面提到,面向特定功能設計的處理器運作起來效率高,而如果要把 GPU 做成可程式設計的,則 GPU 的運作效率會比之前低,而且要在算力、記憶體等各方面的增加額外成本。

英偉達把可程式設計 shader 及适配顯示卡做出來了,可是圖形開發者還沒有準備好為未來買單。他們所開發的遊戲和圖形計算應用,在當時還無法從可程式設計 shader 技術中獲益。結果就是,英偉達搞的新技術和産品很好很強大,從消費者的視角來看卻過于昂貴且沒用。

“這個處理器架構是全新的,可程式設計像素 shader 在過去從來沒有過,可程式設計的 GPU 處理器和程式設計模型也前所未有——所有這些尴尬的現實,我們都隻能咽到肚子裡。”黃仁勳說。

平庸向左,黃仁勳向右

GTC 2020,黃仁勳從烤箱裡拿出即将釋出的顯示卡

"咽下去之後,我們接下來組建了編譯器團隊,研究 SDK和庫,到處去找開發者去跟他們安利我們的新架構,讓他們意識到這套東西的好處——我們甚至要自己動手開發庫,拿給開發者看把他們的應用導入到我們這裡有多容易、有哪些好處;我們甚至用了市場營銷的預算,幫開發者營銷他們用我們架構開發的新産品,來創造市場需求……"

久而久之,英偉達不再是一家硬體公司了。可以說它是為了體面地活下去,而不得不實作了“硬體技術+軟體體驗+開發生态”垂直整合的技術平台公司。

後來的 GeForce、CUDA、Tensor Core 等,每一個在英偉達公司技術發展曆程上寫下濃墨重彩一筆的技術,從某些角度上都和可程式設計 shader 相似:超前的技術能力、較高的可程式設計自由度、面向生态合作夥伴開放的商業模式等。

但與此同時,它們其實都是黃仁勳為了避免英偉達走向平庸而決定推出的。如果沒有 Shader、CUDA、RTX、DGX 等這些在各自的誕生時間點上顯得“離經叛道”的技術,今天的英偉達恐怕早已淪為一家普通的顯示卡公司,和今天挂着 GeForce 的名号生産顯示卡的那些我們耳熟能詳的品牌,沒有多少不同。

4.

英偉達最近幾年全力投入 AI 技術的支援,同樣是避免公司走向平庸的結果。

按黃仁勳的說法,英偉達公司曆史上幾次具有裡程碑意義的關鍵技術推出,背後其實都是對自家 GPU 技術的發展成果進行了“泛化”(generalize),然後發現居然它可以做更多不同的事情。

結果就是,英偉達在不斷遷移和泛化 GPU 能力的過程中,建立了一套全新的,基于 GPU 技術的計算機科學架構。

而當人工智能時代來臨的時候,英偉達搭建好的這套新架構非常适合用來加速深度學習方面的任務。

正是在這樣的條件下,黃仁勳從之前的顯示卡大王變成了如今的 “AI教父”。但如果有人以為英偉達隻是碰巧趕上這波 AI 的浪潮,那他就大錯特錯了。

早在十年前,黃仁勳就已經相信,圖形計算加速成就了早年的英偉達那樣,而新時代的英偉達應該全力投入到 AI 計算的加速上,而且沒有别的公司比英偉達更适合做這件事。

一個最典型的例子就是機器人 (robotics)。黃仁勳表示:“一個經典的機器人問題,涉及感覺、推理、規劃,以及之後許許多多的不同任務。這些任務涉及多個傳感器的大量實時資料;并且出于多元化和備援的目的,處理器需要用不同的算法進行處理。”這些任務的特性,正好是英偉達的 GPU 架構所擅長的。

包括 AI、自動駕駛、資料中心/高性能計算、超級計算機、工業邊緣計算、元宇宙相關的融合現實互動技術等等……現在如果我們去英偉達的網站上,會看到這家公司簡直無所不做,早已不是大部分普通消費者使用者所認識的那家顯示卡公司了。

這些較新的業務,都可以被視為英偉達避免平庸而不斷突破自己邊界的展現。

在采訪中,黃仁勳說自己這一生最大的禮物,就是身邊有着一群世界上最富有才能的同僚。而他自己最大的才能,是堅韌不拔。

“我堅持這條路的時間比其他人都長,但那隻是因為我有耐心而已。隻要我標明了一條道路,我能夠一直在上面走很長很長的時間。這就是我的耐心。”

平庸向左,黃仁勳向右

繼續閱讀