天天看點

專訪那個與英偉達叫闆的女人:AI晶片沒有護城河 選擇開放至關重要

專訪那個與英偉達叫闆的女人:AI晶片沒有護城河 選擇開放至關重要

劃重點:

--AMD CEO蘇姿豐稱除GPU之外,目前全球晶片市場整體供求平衡。

--《晶片和科學法案》利好美國半導體行業,但取得實效仍需多年時間。

--AMD正在開發AI晶片MI300,訓練工作負載能夠比肩英偉達H100。

--人工智能晶片開發沒有護城河,選擇開放、特别是開放軟體尤為重要。

專訪那個與英偉達叫闆的女人:AI晶片沒有護城河 選擇開放至關重要

AMD首席執行官蘇姿豐 ( Lisa Su )日前在The Code Conference大會上與美國知名科技媒體人尼萊·帕特爾(Nilay Patel)進行了一場深度對話。雙方讨論了許多話題,尤其是關于人工智能和晶片供應鍊的問題。

過去幾年,由于新冠肺炎疫情加劇了全球晶片短缺;如今,由于大型科技企業都想運作人工智能模型,導緻需求突然再次激增。

蘇姿豐表示,目前供需平衡總體上處于一個相當好的狀态,隻有支援大型人工智能模型的高端GPU是個例外。蘇姿豐還談到,美國要實作晶片的自給自足仍有很長的路要走。以下為訪談内容摘要:

問:我有許多問題需要問你。讓我們從一些令人興奮的事情開始。AMD今天在AI市場制造了一些新聞。這是怎麼回事?

蘇姿豐:首先,今年Code Conference大會的主題是人工智能,這也是這些天來科技産業的主題。當我們看到計算真正推動人工智能發展的所有機遇時,這正是我們努力的方向。是以,今天早上,我們确實收到了一家名為Lamini的初創公司的公告。我們一直在同這家偉大的公司合作,它擁有一些大型語言模型的頂尖研究人員。

當我與各個公司的首席執行官交談時,所有的人都會問:“我知道我需要關注人工智能。我知道我需要做點什麼。但我該怎麼辦呢?這太複雜了,有很多不同的因素。”借助像Llama這樣的基礎模型,許多企業實際上希望使用自己的資料定制化這些模型,確定可以在私有環境中讓應用程式做到這一點。Lamini從事的就是這項工作。Lamini實際上為企業定制模型、微調模型,這家公司采用的是AMD的GPU。是以這是一件很酷的事情。我們花了很多時間和這家公司合作,真正優化軟體和應用程式,以便盡可能輕松地開發為企業微調的模型。

問:我想深入讨論一下軟體問題。我認為把不同層次的軟體開發從硬體中抽象出來是非常有趣的。但讓我們回到主題。在晶片市場,我們正在結束每個工藝節點的晶片都受到相當令人難以置信的限制的時期。你認為我們目前的處境如何?

蘇姿豐:這個話題非常有趣。我想我在半導體行業從業已有至少30年時間。在很長的一段時間裡,人們甚至不了解半導體是什麼,它們在整個供應鍊中的位置,以及它們是應用程式所必須的。我認為過去幾年,特别是随着大流行驅動的需求以及我們在人工智能方面所做的一切,人們現在真正開始關注半導體。

我認為這是一個巨大的循環。首先是我們需要的晶片比供應多得多的周期,其次是生産的晶片過多的周期。但歸根結底,我認為事實是半導體對于許多應用程式而言都是必不可少的。尤其是對我們來說,我們關注的是最複雜、最高性能、最前沿的半導體。我要說的是,這個市場将會大幅增長。

問:你覺得現在的瓶頸是什麼?是最尖端的嗎?還是我們在晶片短缺期間聽到的在較舊的工藝節點上的問題?

蘇姿豐:我認為,整個行業已形成了一個生态系統,為確定滿足總體需求投入了大量資源。是以總的來說,我會說除了GPU之外供需平衡非常好。如果需要GPU來進行大型語言模型訓練和推理,它們目前的供應可能稍微有點緊張。

但事實是,我們絕對在付出巨大的努力,讓整個供應鍊加速發展。這些是世界上最複雜的裝置--數千億個半導體,大量先進技術。但總體供應絕對在增加。

問:去年通過的《晶片和科學法案》對美國的半導體廠進行了大量投資。AMD顯然是全球最大的無廠半導體公司。《晶片和科學法案》是否已經産生了明顯的效果,或者我們仍需要等待它結出果實?

蘇姿豐:我确實認為,如果看看《晶片和科學法案》,以及它為美國半導體行業所做的一切,它真的是了不起。不得不說,我向吉娜·雷蒙多(Gina Raimondo,美國商務部部長)以及美國商務部與工業界所做的一切緻敬。這些都是需要很長時間的事情。美國的半導體生态系統五年前就需要建立。它現在正在擴張,尤其是在前沿領域,但這需要一些時間。

是以說,我目前還不知道我們是否感受到了影響。但我們一直相信,長期投資越多,影響就會出現。是以我對美國本土的産能感到興奮。我也對我們國家研究基礎設施的一些投資感到非常興奮,因為這對長期的半導體實力和上司地位也極其重要。

問:AMD的财務資料就能夠證明這一點。AMD目前賣出的晶片比幾年前多得多。你在哪裡找到的供應?當等待新的半導體工廠出現時,AMD是否還在依賴台積電?

蘇姿豐:當看看我們所處的業務時,就會發現它正在推動技術的前沿。是以,我們始終處于最先進的節點上,并努力實作下一個重大創新。這是工藝技術、制造、設計和設計系統的結合。我們對與台積電的合作感到非常高興。台積電是世界上最優秀的企業,擁有先進和領先的技術。

問:AMD能否擺脫台積電?

蘇姿豐:我認為關鍵是地緣的多樣性。當你考慮到地緣多樣性時,無論發生什麼,這都是真的。沒有企業希望固守成規,因為風險會随之出現。這就是《晶片與科學法案》實際上有所幫助的地方,因為現在美國正在建造大量的半導體制造廠。它們實際上将在未來幾個季度開始投産,我們将積極在美國進行部分制造。

問:當英特爾首席執行官帕特·基辛格(Pat Gelsinger)參加俄亥俄州工廠奠基儀式時,我與他進行了交談。英特正試圖成為一家半導體代工廠。他非常自信地對我說:“我希望在其中一個半導體工廠的側面有AMD的标志。” 他離實作這一目标還有多遠?

蘇姿豐:我想說,從美國國内制造業來看,我們确實正在尋找很多很多的機會。我認為英特爾首席執行官有一個非常雄心勃勃的計劃,而且我認為這就是目标。我認為我們總是關注誰是最好的制造合作夥伴,對我們而且最重要的是真正緻力于前沿技術的企業。

問:在這方面,市場上有沒有台積電的競争對手?

蘇姿豐:市場上總是有競争的。台積電當然非常不錯。三星電子當然也在進行大量投資。你提到了英特爾。我想日本也在來培養先進的制造業。是以有很多不同的選擇。

問:你提到GPU目前供不應求。就拿Nvidia H100來說,實際上存在擷取這些晶片的黑市。AMD有GPU,而且正準備推出新款GPU。你剛才還提到,Lamini的訓練完全在AMD的GPU上進行。因為英偉達的GPU供應有限,AMD是否看到了擾亂市場的機會?

蘇姿豐:我想退後一步,談談人工智能市場正在發生的令人難以置信的事情。如果你想想我們在過去十年或二十年看到的技術趨勢--無論談論的是網際網路、手機革命還是PC如何改變事物--就人工智能對我們所做的一切的影響而言,它是它們的十倍、百倍不止。

是以,從生産力的角度來看,無論是企業、個人或社會生産力,人工智能的影響都将會是巨大的。是以,GPU短缺的事實,我認為并不奇怪,因為人們已經認識到這項技術的重要性。現在,我們正處于人工智能,特别是生成式人工智能如何進入市場的初期,我認為我們正在談論的是十年周期問題,而不是在接下來的兩到四個季度中你可以獲得多少顆GPU。

AMD對自己的路線圖感到興奮。我認為,對于高性能計算,我将生成式人工智能稱為高性能計算的殺手級應用。你需要的越來越多。盡管今天的大型語言模型已經很好,但如果繼續提高訓練性能和推理性能,它仍然可以變得更好。

這就是我們所做的。我們制造了最複雜的晶片。我們确實還将會推出一款新産品。如果你想知道它的代号,就叫它MI300,它會非常棒。它的目标是大型語言模型訓練以及大型語言模型推理。我們看到機會了嗎?是的。我們看到了巨大的機遇,而且不僅僅是一個。雲計算服務提供商是唯一使用者的想法是不正确的。将會有很多企業人工智能。許多初創公司在人工智能方面也獲得了巨額風險投資支援。是以,我們在所有這些領域都看到了機遇。

問:新産品的名字是MI300嗎?

蘇姿豐:是的。

問:在性能方面,它會與英偉達H100相當,還是超過H100?

蘇姿豐:就訓練工作負載而言,它當然會具有競争力,而且在人工智能市場中,也沒有一體适用的晶片産品。有些晶片在訓練中表現出色,有些在推理上表現出現,這取決于你如何将它們組合在一起。

我們通過MI300所做的是建構了一款出色的推理産品,特别是針對大型語言模型推理。是以,我們現在所做的大部分工作是公司訓練和決定它們的模型将是什麼。但展望未來,我們實際上認為推理的市場規模會更大,這與我們設計MI300初衷不謀而合。

問:如果看看華爾街認為英偉達的模式是什麼,那就是CUDA、專有軟體堆棧、與開發者的長期關系。AMD的ROCm模式略有不同。你認為這是一條可以通過更好的産品或更開放的方法來攻克的護城河嗎?AMD将會如何攻擊?

蘇姿豐:當市場發展如此之快時,我不相信有護城河的存在。當你想到護城河時,它是更成熟的市場,人們并不真正想要改變很多事情。當你觀察生成式人工智能時,你會發現它正在以令人難以置信的速度發展。我們目前在正常開發環境中幾個月内取得的進展,過去可能需要幾年時間。尤其是軟體,我們選擇的是開放軟體。

實際上存在二分法。如果看看過去五年、七年或八年開發軟體的人,他們傾向于使用……讓我們稱之為更特定于硬體的軟體。它非常友善。但當時沒有太多選擇,智能選擇這個。當展望未來時,實際上會發現每個人都在尋求建構與硬體無關的軟體的能力,因為人們想要選擇。坦率地說,人們想要選擇。人們希望使用舊的基礎設施。人們希望確定他們能夠從一種基礎設施遷移到另一種基礎設施。是以,他們正在建構這些更進階别的軟體。例如,類似開源的Python機器學習庫PyTorch這樣,往往具有與硬體無關的功能。

我确實認為未來十年将與過去十年不同,因為這關系到你如何在人工智能中發展。我認為我們在整個行業和生态系統中都看到了這一點。開放式方法的好處是沒有一家公司擁有所有的理念。是以,我們越是能夠将生态系統整合在一起,就越能利用所有希望加速人工智能學習的非常睿智的開發人員。

問:PyTorch未來的發展極其巨大,對嗎?這是所有這些模型實際編碼所用的語言。我與一些雲供應商的首席執行官交談過,他們都不喜歡依賴于英偉達,就像任何人不喜歡依賴任何一家商家一樣。你可以與這些雲供應商合作,并說“我們将針對PyTorch而不是CUDA優化我們的晶片,”然後開發人員可以在PyTorch上運作并選擇最佳優化的嗎?

蘇姿豐:确實如此。如果想想PyTorch正努力做什麼--它确實在努力成為那種與硬體無關的層。我們在PyTorch 2.0上實作了一個主要裡程碑,AMD在第一天就獲得了資格。這意味着現在在PyTorch上運作CUDA的任何人,都可以開箱即用地在AMD上運作。坦率地說,它也可以在其他硬體上運作。

但我們的目标是“讓最好的晶片獲勝”。這樣做的方法是讓軟體更加無縫。它可以是PyTorch,可以是Jax,也可以是OpenAI在Triton中引入的一些工具。有很多人也在做“建構自己的”類型的事情。是以我确實認為這是人工智能軟體的未來浪潮。

問:AMD是否在為上述公司開發定制化的晶片?

蘇姿豐:我們有能力開發定制化晶片。我認為開發定制晶片的時機實際上是當得到大量應用的時候。是以我相信在接下來的幾年裡會有定制晶片出現。另一件有趣的事情是,你需要各種不同類型的人工智能引擎。是以,我們花了許多時間讨論大型GPU,因為這是處理大型語言模型所需要的。但你也會看到一些ASIC晶片。你還将在用戶端晶片中看到人工智能。是以,我對人工智能将如何廣泛地融入所有細分市場的晶片感到非常興奮。

問:我們談論的是在很大程度上提高成本曲線的事情:許多聰明人在尖端流程節點上做了大量工作來開發真正高端的GPU。一切都變得越來越貴,你可以看到消費者的應用程式是多麼昂貴:每月25美元,微軟Office 365 Copilot的定價為每使用者每月30美元。你什麼時候才能得到降低消費者價格的成本曲線?

蘇姿豐:這是一個非常好的問題。我相信,人工智能在生産力方面的價值絕對會得到證明。誠然,目前這些基礎設施的成本很高,但另一方面使用者得到的生産力提升也令人興奮。我們正在AMD内部部署人工智能,這是一個高度優先事項,因為如果我們能更快地設計出晶片,它就能帶來巨大的生産力。

問:你信任人工智能嗎?你會讓員工檢查人工智能正在做的工作嗎,或者是完全信賴它?

蘇姿豐:我們都在嘗試,對吧?我們正處于建構工具和基礎設施,以便進行部署的早期階段。但事實是人工智能節省了我們的時間--無論我們是在設計晶片、測試晶片還是驗證晶片--它節省了我們的時間。在我們的世界裡,時間就是金錢。

但回到你的問題,什麼時候能夠降低成本曲線。我認為這就是為什麼需要廣泛思考人工智能,而不僅僅是在雲端如此重要。如果想想幾年後生态系統會是什麼樣子,你會想到由雲基礎設施來訓練這些最大的基礎模型,但你也會有一些邊緣人工智能。無論是在電腦裡還是在手機裡,都可以進行本地人工智能。本地人工智能服務更便宜、更快,而且當你這樣做的時候,實際上更私密。是以,這就是人工智能無處不在的理念,以及它如何真正增強我們目前的部署方式。

問:我們應當如何監管人工智能?

蘇姿豐:我認為這是我們大家都非常認真對待的事情。從生産力和發現的角度來看,這項技術有很大的優勢,但人工智能也有安全性的問題。我确實認為,作為大公司,我們有責任。如果考慮圍繞資料隐私的兩件事,以及在開發這些模型時確定它們在沒有太多偏見的情況下盡我們所能進行開發。我們會犯錯誤的。整個行業在這裡不會是完美的。但我認為,人工智能的重要性是明确的,我們需要共同努力,需要建立公共/私有夥伴關系來實作這一目标。

問:如果接受監管,晶片是否會受到限制?

蘇姿豐:是的,我會接受一個機會,讓我們看看需要采取哪些保障措施。

問:我認為這将是最複雜的一次……我不認為我們期望晶片在我們能做的事情上受到限制,感覺這是一個我們必須要問和回答的問題。

蘇姿豐:我再說一遍,不是晶片本身的問題。因為一般來說,晶片具有廣泛的功能。這個問題與晶片加上軟體和模型有關。特别是在模型方面,你在安全措施方面做了什麼。

問:AMD的晶片已經出現在PS5和Xbox當中。有一種觀點認為,雲遊戲是所有事物的未來。這對AMD來說可能很好,因為AMD也會在它們的資料中心。但你看到這種轉變正在發生嗎?這是真的嗎,還是我們仍在遊戲主機時代?

蘇姿豐:遊戲無處不在。人們一直在談論:這是主機遊戲的終結嗎?我看不出來。我認為PC遊戲很強大,我認為主機遊戲很強大。我認為雲遊戲也很強大。它們都需要類似類型的技術,但它們顯然以不同的方式使用它。(無忌)