馬斯克到訪中國後,特斯拉股價大漲,馬斯克身價飙漲到1923億美元,重返全球首富寶座。
财富驚人的暴漲效果,讓英偉達再也按捺不住了,根據内部人士透露,英偉達CEO黃仁勳将于6月初到訪中國。
市場消息稱:黃仁勳此次訪華,将會見騰訊、位元組跳動、比亞迪、小米、理想等企業高管。其目的自然是賣他的AI晶片。
随着ChatGPT的爆火,AI産業快速發展,算力作為AI底座與基礎更是需求暴漲,已經達到了10年前的30萬倍。這讓AI晶片龍頭英偉達賺得盆滿缽滿。
受此影響,5月30日,英偉達股價大漲至419美元,市值突破1萬億美元,成為全球“最值錢”的晶片企業。
為了確定自身優勢,進一步擴大全球市場,英偉達不斷的向中國示好,CEO黃仁勳更是直言“不要低估中國晶片的實力”。
那麼問題來了,英偉達會繼續為中國企業提供AI晶片嗎?國産AI晶片是買還是自主研發呢?
英偉達到底強在哪裡?
英偉達建立于1993年1月,總部位于美國加州,是一家設計顯示晶片為主的人工智能計算公司,也是GPU的發明者。
英偉達緻力為遊戲、娛樂、PC、雲資料中心、網絡、人工智能提供一流的晶片和軟體服務。
英偉達究竟有多強呢?
最直覺的市值對比:英偉達市值一度達到了1萬億美元(約合70800億人民币),相當于A股的貴州茅台(2.1萬億),+工商銀行(1.7萬億)+中國移動(2萬億)+甯德時代(近1萬億)。
是台積電市值的近2倍,英特爾市值的7倍,高通市值的8倍,中芯國際的16倍。也是全球“最貴”的晶片企業。
市場佔有率方面:英偉達在獨立顯示卡市場占據了88%的份額,在AI 資料中心GPU領域占據了90%的份額,在全球AI市場領域,英偉達占據了80%的份額。
可以說,英偉達在遊戲顯示卡、GPU、AI領域全面碾壓英特爾、AMD。
應用場景方面:英偉達的GPU已經從單一的遊戲顯示卡,快速滲透至人工智能、超算、量子加速、自動駕駛、網際網路、光刻技術等多個領域。
未來,随着科技的快速發展,英偉達涉及的領域将越來越廣,甚至會出現GPU≥CPU。
英偉達最強的是算力加持,遇到人工智能的風口,将越飛越高。
數字時代,算力為王,随着數字經濟快速的發展,未來算力就是經濟的基石,想要發展經濟就必須夯實算力基礎。
根據IDC研究報告:算力每提高1點,國家的數字經濟和GDP将增加3.5%和1.8%。
當算力影響到GDP時,不要說經濟學專家、晶片巨頭,哪怕是普通老百姓也意識到人工智能晶片的重要性了。
然而,這些晶片的話語權,有很大一部分掌握在英偉達手中。
公開資料顯示:全球前500的超算,70%使用了英偉達的GPU,最新超算使用比例達到了90%。而AI大模型更是離不開英偉達。
是以黃仁勳宣稱:過去十年,摩爾定律的性能提升了100倍,而英偉達的GPU性能提升了100萬倍,未來十年摩爾定律會失效,但自己的“黃氏定律”不會失效。
老黃直接将自己比肩戈登.摩爾,甚至宣稱未來将是“黃氏定律”的天下,半導體領域CPU的地位也應該讓給GPU。
老黃已經開始飄了,照這樣發展下去,哪天老黃将挑戰“牛頓定律”了。
按照黃仁勳的算法:未來十年,英偉達可以讓人工智能的性能提升100萬倍,讓人工智能真正地覺醒。
為了讓英偉達更快的擴大優勢,黃仁勳還推出了一種全新的業務——“算力租賃”。
我們租房、租車、租電店面、租女友,如今我們可以租“算力”了。
舉個例子:你是一家自媒體公司的老闆,手下有十幾個員工,每天寫文章、拍視訊、剪輯視訊,但是産出量有限。你想提升效率,又不想招聘更多的文案員,怎麼辦?
使用AI大模型創造,但是通用的大模型,包括ChatGPT都無法做出高品質的文章和視訊。
這就需要你自己訓練一個特定的大模型,這個大模型更适合特定的領域,例如電商、曆史、旅遊等。
訓練大模型需要龐大的算力,GPT-3訓練一次的成本約為140萬美元,普通企業根本承擔不起,怎麼辦呢?租英偉達的算力,來訓練自己的AI大模型。
每月3.7萬美元,包含8個A100晶片,可以在雲端訓練ChatGPT。當然你也可以出更高的價格,體驗更快的訓練服務。
這種“算力租賃”的方式,可以讓企業降低等待算力資源的時間,盡早介入人工智能,開展相關業務。
此外,英偉達還為晶片領域提供服務
英偉達釋出了一個用2nm制造的突破性計算光刻技術——NVIDIA cuLitho計算光刻庫。
晶片在設計和制造環節需要大量的計算,随着晶片制程的變小,半導體數量的增加,傳統的CPU計算方法越來越耗時。
而采用英偉達的GPU方案可以将計算速度提升40倍,大大提高了晶片設計和制造的速度。
例如,兩周才能制造好的掩膜版,可以縮短至8小時。
這個方案已經吸引了制造龍頭台積電、EDA龍頭新思科技、光刻機龍頭ASML等。
用黃仁勳的一句話說:“AI 的 iPhone 時刻已經來臨!因為有了英偉達。”
英偉達繼續為中國提供服務
2022年8月,英偉達接到通知,限制對中國提供用于人工智能和資料中心的頂級計算晶片。接到該通知的還有AMD何英特爾。
據悉,英偉達此次受限的産品包括 A100 和 H100 高性能GPU。
A100是是專門為無人駕駛量身打造的,蔚來、小鵬、法拉第FF 91等都采用了這款GPU。
A100采用了台積電7nm工藝,內建了540億個半導體,其性能也比上一代 V100 提高20倍。而且它是一塊 3D 堆疊晶片,面積高達 826mm^2,GPU的最大功率達到 400W。
算力方面,A100的16位浮點算力達到312T、8位定點算力達到624T,在稀疏模式下算力可以實作翻倍。
同時,A100還支援多執行個體技術,可将一個A100 分割成7個獨立的小型GPU,進而實作多個任務同時計算,大幅提高使用率。
H100是英偉達的殺手锏産品。
H100采用了Hopper架構,台積電4nm制造技術,內建了800億個半導體,擁有18432個CUDA核心、576個Tensor核心、60MB二級緩存。
算力方面,H100 6位浮點算力達到1000T、8位定點算力達到2000T,在稀疏模式下算力可以實作翻倍。比上一代A100算力提升了3.2倍,整體性能提升了6倍。
在資料吞吐方面,H100可實作3TB/s 的顯存帶寬,5TB/s的網際網路速度。
H100還可以拆分GPU,一個單元拆分為7個,同時進行不同的運算任務,并且可以将單個單元性能提升7倍。
H100售價達到了24萬人民币,抵得上一款不錯的轎車了。
按照美國的政策,我們很難購買到A100、H100,怎麼辦呢?英偉達想出了一個辦法,那就是設計一款專門向中國供貨的GPU,既符合政策要求,又能繼續占領市場。
于是A800、H800誕生了,用來平替A100、H100。
A800還算良心,核心數量、單精度、雙精度、顯存帶寬、整體算力都完整保留了下來。隻是在多卡互連性能受到了影響。
A100畢竟是3年前的産品,并且明顯落後于H100,如果再削弱太多的話,恐怕出貨量将受到嚴重影響。
相比A800,H800則有點過分,H800主要将資料傳輸速率降低到H100速率的一半左右,這真是又要賺錢,又要限制别人,着實惡心。
在這場AI淘金熱中,英偉達扮演着“鏟子提供商”的角色,在某種程度上它并不在乎誰能挖到更多的金子,而是要考慮它的鏟子賣的怎麼樣。
如果賣給美國企業“鐵鏟”,賣給中國企業“木鏟”的話,差别太大,反而刺激中國企業大力搞自主研發,同時也會被其他鏟子企業鑽空子。
但是美國則不同,它要確定挖到最多、最大的金礦,是以必須要限制中國企業拿到先進的“鏟子”,是以未來H800仍有可能會降低算力。
英偉達想繼續為中國企業提供算力服務,而美國政府又想限制中國企業在AI領域的發展。這種政策,導緻我們揮着昂貴的“破鏟子”,去挖沒有含金量的破石頭。
如何破解這種局面呢?繼續搞自主研發吧!
自主研發AI晶片究竟差在哪裡?
其實國産AI晶片企業我們也有,壁仞科技、摩爾線程、景嘉微、寒武紀、燧原科技、瀚博半導體等。但是,整體與英偉達差距太大了。
僥幸有一家在算力方面突圍了,卻在生态和制造環節被限制了。
2022年世界人工智能大會上,上海壁仞科技釋出了BR100系列AI晶片,絕對算是國産晶片的驕傲。
BR100采用了台積電7nm工藝,內建了770億半導體。16位浮點算力達到1000T以上、8位定點算力達到2000T以上,單晶片峰值算力達到PFLOPS級别。
BR100在算力方面可以媲美英偉達H100。
但是BR100存在兩個最大的缺陷:第一、生态落後;第二、制造受限。
晶片設計由難到易依次是:手機SoC>CPU>GPU。
華為設計的麒麟系列手機SoC,已經可以媲美高通骁龍,甚至在某些方面超過了高通;而龍芯也早就研發出自主的LoongArch架構,性能方面也與英特爾差距縮小至4年。
那麼相對簡單的GPU設計不出來?這恐怕說不通吧!
國産GPU落後英偉達更多的是在生态方面,英偉達建立的GPU+CUDA生态模式,成為領先的關鍵。
CUDA平台易于程式設計和性能強大,同時擁有廣泛而豐富的生态系統。
CUDA平台擁有可用的工具、庫、應用程式和合作夥伴。
工具方面:CUDA工具包,提供了使用C/C++程式設計語言的開發環境,同時,還提供了一個PGI工具包來使用Fortran語言程式設計。
庫方面:庫可以優化計算架構、提高軟體品質、節省程式開發時間,加速GPU。
英偉達提供了一個名叫CUDA-X的庫,支援跨領域的加速下降,如線性代數、圖像和視訊處理、深度學習和圖形分析。
衆多合作夥伴也為英偉達平台貢獻了許多庫。
英偉達的合作夥伴衆多,除了ARM、台積電、英特爾、三星、新思科技這類晶片巨頭,還有亞馬遜、FaceBook、百度、阿裡、騰訊等網際網路巨頭。
如今在A股上,一旦攀上英偉達,股價就會狂飙。
英偉達實在太強大,國内AI晶片企業就是被卡在生态上,導緻發展緩慢。
制造方面:
優秀的晶片基本都是由台積電代工的,蘋果A系列、高通骁龍、華為麒麟、英偉達A、H皆是如此。
是以,即便你設計出了強大的AI晶片,依然要拿到台積電的代工資格。
衆所周知,華為被列入實體清單後,就失去了台積電的代工資格。如果有一家中國企業達到了英偉達的水準,影響到老美的利益,它還會拿到代工資格嗎?
内地中芯國際的水準落背景積電3代,這還是在使用進口裝置的前提下,根本無法滿足先進AI晶片的代工需求。
是以說,内地晶片企業不是設計不出先進的AI晶片,而是無法突破生态和制造。
寫到最後
本月,也許是明天,或者下周,黃仁勳就會通路中國,屆時會大談如何為中國企業服務,如何保證供應中國先進的AI晶片。
同時對内地企業、政府展開攻關,以保證在中國市場的利益。
但是,英偉達保證的供應是建立在遵守美國意願的前提下,在確定中國AI落後的前提下,在確定國産AI晶片無法超越的前提下。
如果,你想繼續被他人“卡脖子”,就請接受黃仁勳的建議吧!别忘了5月29日,黃仁勳還說:“中國有很多GPU(圖形晶片)的初創公司,不要低估中國在晶片領域的追趕能力。”
我是科技銘程,歡迎共同讨論!