人工智能技術的迅猛發展讓各大科技公司紛紛加大在該領域的投入。作為全球科技巨頭之一的谷歌,正積極探索降低人工智能開發成本的方法。近日,有知情人士透露,谷歌高管已開始讨論在最快的時間内放棄博通作為其人工智能晶片供應商的計劃。該計劃的核心是通過完全自主設計張量處理器(TPU),進一步降低人工智能開發的成本。
在目前人工智能領域的開發中,資金投入往往是一項重要的成本。而相比其他類型的計算,人工智能開發尤為昂貴。谷歌一直在不遺餘力地投入資金用于人工智能的研發和應用,而自主開發TPU則有望為谷歌每年節省數十億美元的成本。是以,該計劃被視為谷歌削減人工智能支出的重要舉措。
博通是谷歌目前的人工智能晶片供應商之一,負責設計和供應張量處理器(TPU)。然而,根據知情人士的透露,谷歌高管已在今年年初确定了未來不再與博通合作的決定。取而代之的是網絡接口晶片供應商Marvell。去年因全球晶片短缺,博通将網絡接口晶片價格上調了30%,這讓谷歌感到非常惱火。于是,谷歌決定将博通替換為Marvell,兩者計劃于明年推出一款名為“Granite Redux”的内部網絡接口晶片。
從經濟角度來看,博通的TPU業務利潤率高達70%。這一資料與晶片研究公司SemiAnalysis的預估資料相一緻。谷歌計劃将不再依賴博通,可以更好地控制人工智能開發的關鍵成本。谷歌目前正在大力開發大型語言模型,以支援其新産品(如Bard聊天機器人)和面向谷歌雲客戶的人工智能服務。根據谷歌首席财務官露絲·波拉特的表示,該公司對人工智能資料中心硬體的投資将在2023年下半年和2024年增加。這将導緻對英偉達制造的圖形處理器和TPU的支出增加。僅2023年上半年,谷歌的資本支出總額就達到了132億美元。
根據谷歌的财務資料分析,該公司的人工智能軟體開發團隊每季度至少投入6億美元,年度支出高達24億美元。如果谷歌成功地實作自主開發TPU,預計每年可以節省數十億美元的開支。然而,這也将對博通為其客戶制造專用晶片的業務造成一定的損失。分析師表示,過去一年中,人工智能晶片的需求出人意料地增長,使得博通成為全球第二大人工智能晶片制造商,僅次于英偉達。
谷歌預計今年将向博通支付大約20億美元以購買TPU。根據摩根大通分析師哈倫·蘇爾今年5月的估計,谷歌可能在今年向博通支付30億美元的TPU采購費用,并且這一數字可能還會上升。根據SemiAnalysis的資料,由于人工智能産業的繁榮,預計到明年年底,谷歌将向博通支付總計70億美元用于購買TPU。谷歌決定自主設計人工智能晶片的舉措與亞馬遜類似,後者已經多年前開始自主開發人工智能晶片。此外,微軟目前也在嘗試自主開發人工智能晶片。谷歌和亞馬遜已經将自主研發的晶片應用于支援其自有的人工智能産品伺服器,并将這些伺服器租賃給雲客戶。
相對于英偉達的圖形晶片,谷歌的TPU和亞馬遜的人工智能伺服器晶片并未受到雲客戶的熱烈歡迎。但是作為谷歌雲和亞馬遜雲服務AWS長期戰略的一部分,它們可以減少對英偉達的依賴。随着OpenAI推出ChatGPT等大型語言模型,英偉達晶片供不應求已有一年之久。今年4月,谷歌将TPU開發團隊轉移到谷歌雲,以提高向雲客戶出租TPU伺服器的能力。至今為止,谷歌與博通合作設計了兩種類型的TPU,分别是用于機器學習模型訓練的訓練晶片,以及為這些模型提供計算能力的推理晶片。例如,谷歌的TPU在分析其照片應用程式中的數十億張照片時發揮了重要作用,用于訓練可以自動識别人臉和物體的人工智能模型。谷歌還投入大量的TPU來訓練即将推出的多模态模型Gemini。
自2016年以來,谷歌一直與博通合作開發TPU。TPU對谷歌的機器學習功能至關重要,從提供廣告到翻譯和了解搜尋查詢都離不開它。2017年起,谷歌開始向有興趣訓練自有人工智能模型的雲客戶提供TPU算力。谷歌與博通之間的合作一直在不斷發展。當時的情況是,谷歌隻需要少量的TPU,并且希望能夠盡快生産出來,是以選擇了合作開發模式。合作開發需要較少的員工,相對來說更加迅速。真正意義上,谷歌從博通那裡購買的晶片是根據谷歌的設計圖紙定制的。同時,博通還提供了關鍵技術。根據知情人士透露,博通每年向谷歌收取數千萬美元的專利費。
在谷歌與博通合作期間,博通負責TPU的實體設計,這本質上是基于谷歌的設計圖紙來開發晶片。此外,博通還負責監督台積電的晶片代工業務。自谷歌與博通展開合作以來,谷歌每兩年左右釋出新一代的TPU。知情人士表示,谷歌和博通讓每一代TPU的成本效益提高了至少50%。在過去的四年裡,谷歌聘用了越來越多的晶片設計師,逐漸參與到TPU的設計中。2019年,谷歌由于人工智能産品的需求增加,成立了一個團隊,探索在内部設計自己晶片的可行性,并與不同的合作夥伴(包括博通和Marvell)合作開發TPU和CPU,以節省成本。
2020年,谷歌計劃進一步提高TPU的效率,并通知了博通。這是谷歌首次表現出希望減少對博通依賴的迹象。随後,谷歌于2021年聘請以色列英特爾高管尤裡·弗蘭克(Uri Frank)負責監督谷歌的晶片工作。一年之後,谷歌又從AMD聘請了晶片高管Nikhil Jayaram,他将負責監督TPU團隊的日常營運以及加州山景城總部的其他晶片項目。2022年年中之後,随着人工智能晶片需求的攀升和成本的上漲,谷歌高層開始更多地讨論不再繼續讓博通擔任TPU供應商的可能性,并逐漸實作自主設計TPU的目标。在與博通長達一個月的僵持之後,谷歌和博通最終達成協定,決定不對現有的TPU漲價,但未來兩款TPU——“Ghostfish”和“Ghostlite”将會漲價。
今年年初,谷歌計劃向博通購買30萬塊Ghostfish TPU晶片,每塊售價1.2萬美元,用于處理人工智能模型的訓練;并購買100萬塊Ghostlite晶片,每塊售價1500美元,用于處理人工智能的推理。根據消息,這兩項合同的總金額達到了51億美元。谷歌計劃從2025年開始使用這些産品。對于第六代TPU——Ghostfish和Ghostlite,谷歌計劃使用自己的技術替代博通的部分技術,并進行設計上的修改,以便在未來更容易地替換博通技術。
值得注意的是,谷歌計劃自主研發人工智能晶片的舉措與亞馬遜類似,後者多年前就已開始自主開發人工智能晶片。而微軟目前也在嘗試自主開發人工智能晶片。谷歌和亞馬遜已将自主研發的晶片用于支援其自有的人工智能産品伺服器,并将這些伺服器租賃給雲客戶。不同于英偉達的圖形晶片,谷歌的TPU和亞馬遜的人工智能伺服器晶片并未受到雲客戶的歡迎。然而,它們是谷歌雲和亞馬遜雲服務AWS減少對英偉達依賴長期戰略的一部分。随着OpenAI推出ChatGPT等大型語言模型,對英偉達晶片的需求仍持續走高。今年4月,谷歌将TPU開發團隊劃歸谷歌雲部門,以提高向雲客戶出租TPU伺服器的能力。
谷歌與博通合作開發的TPU分為訓練晶片和推理晶片兩種類型。谷歌的TPU在訓練機器學習模型時發揮了重要作用,并為這些模型提供計算能力。例如,谷歌的TPU在分析其照片應用程式中的數十億張照片時,用于訓練可以自動識别人臉和物體的人工智能模型。而谷歌也大量使用TPU來訓練即将推出的多模态模型Gemini。
谷歌計劃放棄博通作為人工智能晶片的供應商,轉而推行自主研發的政策。通過削減成本和減少對供應商的依賴,谷歌希望更好地掌控人工智能開發的關鍵成本,并在全球人工智能晶片市場競争中保持領先地位。然而,自主研發TPU也面臨一系列挑戰,需要謹慎規劃和實施。未來,随着人工智能技術的不斷發展和應用,人工智能晶片市場将進一步擴大,谷歌的自主研發政策有望推動整個行業的發展程序。