天天看點

ChatGPT:受驚駭的巨頭們與焦慮中的軍備競賽

作者:人人都是産品經理
ChatGPT:受驚駭的巨頭們與焦慮中的軍備競賽

ChatGPT 給微軟帶來了一張王牌,也讓 Google 等手握籌碼的大廠被迫加快了下注的速度和幅度。

由于大模型對算力、人才、資料有極高的需求,是以雖然新一代 AI 應用可能來自創業公司和開源社群,但大公司在這一波科技浪潮中捕獲價值的能力不容忽視。

Ben Thompson 是美國知名科技評論作者,多年來對 FAANG 和其他科技公司進行了很多追蹤和分析。最近他從颠覆式創新的角度,分析了科技巨頭們在大模型和 AI 時代的優勢和挑戰。

海外獨角獸一直在探索未來十年最重要的趨勢,如果要尋找新時代的蘋果和微軟,就需要更深入了解當下新技術與舊巨頭相遇碰撞出的火花。是以我們對 Ben Thompon 的觀點進行編譯,并對五大科技巨頭的布局補充說明。

2022 年蘋果從開源世界收到了一份令人難以置信的禮物:Stable Diffusion,這個模型未來有望內建進 iPhone 手機,開啟 APP Store 新一輪繁榮。

與蘋果面向消費者的業務相反,亞馬遜會通過 AWS 收到許多雲端推理的訂單,但短期會有 GPU 算力不足的焦慮,長期則面臨推理成本久居不下,和下遊公司自建資料中心的巨大變量。

Meta 應該加大對 GPU 資料中心的投資,從長期來看,無論是對于加深自身的廣告業務的護城河,還是将社交媒體和內建式 VR 裝置作為生成式 AI 技術的入口而言,都會有極大的幫助。

對于 Google 而言,這家曾發明了 Transformer 模型的偉大企業和當年的柯達遭遇了同樣的困境,後者也是颠覆式技術數位相機的發明者。因為聊天機器人無需使用者點選,這颠覆了傳統的按點選量付費的搜尋 – 廣告商業模式。

不過,未來無法精準預測,曾經被認為是颠覆式創新受害者典型代表的微軟,如今反而借助雲計算等技術抵達新的浪潮之巅,同時,在生成式 AI 的新一輪技術革命中,微軟處在一個最好的生态位置,也正通過 Bing 結合 Chat GPT 的方式成為新的颠覆者。

生成模型未來會成為一種基礎設施,帶給這個世界更多驚喜,但對單個公司影響力有限,處于産業鍊更上遊的英偉達和台積電很可能成為最大赢家;同時機會也可能來自那些最在乎确定性的行業,因為該行業的傳統公司預計很難給予基于機率統計的人工智能技術以充足的投資,正如當年柯達不會給予基于數字圖像的數位相機技術以充足的投資一樣,但也同當年數字技術一樣,人工智能技術在飛速發展。

以下為本文目錄,建議結合要點進行針對性閱讀。

  • 01 蘋果
  • 02 亞馬遜
  • 03 Meta
  • 04 谷歌
  • 05 微軟
  • 06 英偉達

2022 年堪稱 AIGC 元年,首先出現了圖像生成模型,包括 DALL-E、MidJourney 以及開源的 Stable Diffusion,然後是 ChatGPT,釋出僅兩個月使用者便已經突破 1 億,擴張速度前所未見,表明我們已經進入一個新的技術紀元。

為了确定 AI 時代可能的發展走向,不妨回顧一下 26 年前最著名的戰略書籍之一,克萊頓·克裡斯坦森的《創新者的窘境》,他在其中提出了颠覆式創新(disruptive innovation)的概念:

大多數新技術促進了産品性能的提高,我把這些技術稱為漸進式(sustaining)技術,它們的共同點是沿着主要市場的主流客戶曆來重視的性能次元,改善現有産品的性能。在特定行業中,大多數技術進步是漸進的。

颠覆性技術為市場帶來了與以往截然不同的價值主張。一般來說,颠覆性技術在主流市場上的表現不如成熟産品。但它們有一些局部的,邊緣的(一般是新的)客戶看重的其他特點。一般情況下,基于颠覆性技術的産品更便宜,更簡單,更小,使用起來更友善。

通過觀察創新進入市場後現有公司的表現,便很容易回顧曆史,并确定一項創新是漸進性創新還是颠覆性創新:如果創新是漸進的,那麼現有公司變得更強大;如果是颠覆性的,那麼估計初創公司會抓住大部分的價值。

回顧過去科技時代的節點:

  • 個人電腦對幾乎所有的當時的大公司都是颠覆性的,這些相對便宜和低功率的裝置在能力和利潤率方面甚至比不上微型計算機,更不用說大型機。是以 IBM 最初很樂意把個人電腦的晶片和作業系統分别外包給英特爾和微軟,然後将産品內建後滿足自己的企業客戶;但個人電腦的速度越來越快,當市場将過去的一切都甩在了身後,英特爾和微軟反超 IBM 占據了上風。
  • 網際網路幾乎完全是颠覆式的市場創新,是以由全新的公司來定義,它們颠覆的領域,是在遠離技術的行業,特别是涉及資訊的行業(即媒體),這是谷歌、Facebook、線上市場和電子商務等的時代,所有這些應用都運作在由 Windows 和 Intel 驅動的個人電腦上。
  • 雲計算雖然是網際網路的一部分,但我認為它也是極具颠覆性的:商業 X86 架構壟斷了專用伺服器硬體,一大批 SaaS 初創公司從現有的公司中剝離出功能來建立公司。值得注意的是,雲計算的核心基礎設施主要是由上個時代的赢家建造的:亞馬遜、微軟和谷歌,尤其是微軟,他們已經把其傳統軟體業務已過渡到訂閱模式,逐漸 SaaS 化。
  • 雖然移動網際網路最終被蘋果和谷歌主導,但這并不意味着它不是颠覆性的,蘋果創新了 UI 範式,要求消費者們不會把手機看作是小型電腦;谷歌則創新了商業模式,要求公司們不能把手機終端當作作業系統的直接利潤來源,而是看作廣告業務的護城河 。

這段曆史值得注意的是,颠覆性創新确實一直來自于市場的新進入者,但這些新進入者未必是初創企業:以往的科技時代,一些最大的赢家往往是現有的大公司利用其現有業務優勢進入新領域。同時,克裡斯坦森理論在其他方面也是成立的:微軟在移動網際網路領域十分掙紮,是因為移動網際網路本身是颠覆性的,但由于微軟及時調整了自身的商業模式,是以雲計算時代它并沒有被颠覆,反而在 SaaS 領域始終有漸進性創新。

鑒于現有公司在新世紀的成功,在思考人工智能的影響時,最明顯的起點是五個大廠:蘋果、亞馬遜、Facebook(Meta)、谷歌和微軟。

一、蘋果

著名的科技戰略書籍,喬爾·斯波爾斯基的《戰略信條》 第五章曾提到:

聰明的公司試圖讓它們産品的互補品商品化(commoditize their products’ complements)。

互補品是指兩種商品必須組合在一起才能滿足需要。例如,在相機價格不變時,如果作為其互補品的膠卷的價格大幅度上漲,則人們對相機的需求也會減少;膠卷價格下降,人們對相機的需求則會相應增加。

通俗一些了解,商品化就是用價值換錢的行為。産品商業化的過程就是産品尋求商品變現的過程,所有對産品的投入隻有通過變現才能最終展現商業價值。

而斯波爾斯基是在解釋為什麼大公司會投資開源軟體時寫下這句話:

無論是否開源,完成調試的代碼都是有成本的,即使你不為它支付現金,它也有機會成本、時間成本等。畢竟可用于開源工作的開發人員是有限的,每個開源項目都在與其他開源項目競争同樣有限的程式設計資源,隻有最有前景的項目才擁有足夠多的開發人員。總之,我對那些試圖證明免費軟體的狂熱經濟性的人不感冒,一道“N 除以零”的數學計算題注定是錯誤的。

開源代碼依舊需要遵守經濟規律,我們在 Eazel、ArsDigita、之前知名的 VA Linux 公司和其他許多公司中看到了這一點。但是許多非常大的上市公司,縱然負有使股東價值最大化的責任,但它們正在投入大量資金支援開源軟體,通常是通過支付大量的程式員團隊來進行工作。

這可以用“互補原則”作為解釋:在經濟學中,當一個産品的互補品的價格下降時,對該産品的需求就會增加。一般來說,一個公司的戰略利益是讓它的補充産品的價格盡可能地低,理論上可持續的最低價格是 “商業價格”——即有一群競争對手飽和式競争後的産生的價格。是以,聰明的公司試圖讓它産品的互補品商品化,增加自己的産品的需求,賺取更多的利潤。

蘋果公司投資開源技術,比如開源作業系統的 Darwin 核心和 WebKit 浏覽器引擎,後者符合斯波爾斯基的分析,因為保證網絡與蘋果裝置的良好運作可以使蘋果的裝置更具價值。

與此同時,蘋果在人工智能方面的努力在很大程度上是閉源的:傳統的機器學習模型被用于推薦、圖像識别和語音識别等方面,但這些東西無法對蘋果的業務産生重大影響,不過,2022 年蘋果從開源世界收到了一份令人難以置信的禮物:Stable Diffusion。

Stable Diffusion 之是以引人注目,不僅僅因為它是開源的,還因為它的模型出奇地小:當它被釋出時,它已經可以在一些消費級顯示卡上運作,在幾周内,它已經被優化到可以在 iPhone 上運作 。

這裡壓縮至 iPhone 端運作的說法有些誇張,據官網展示資訊,可以判斷目前該模型可以 Mac 端運作,且圖檔生成時間較慢。

相比于大語言模型動辄千億的參數量,圖像生成模型事實上要小一些,OpenAI 基于擴散模型的閉源模型 DALL-E2 隻有 35 億參數大小,而開源模型 Stable Diffusion 則在保持了生成品質的情況下将模型大小壓縮至 8.9 億 ;主流筆記本電腦內建顯示卡顯存标準為 2GB ,剛剛滿足經過專業優化後的模型運作。

目前移動端裝置顯存要低于筆記本電腦一個數量級,綜合技術進步,預計圖像生成模型 1-2 年後能內建進入手機終端,且體驗良好。

蘋果公司已經抓住了這個機會,上個月其機器學習小組宣布了這個消息:

今天,我們很高興在 macOS 13.1 和 iOS 16.2 中釋出對 Stable Diffusion 的 Core ML 的優化,以及開始部署到蘋果裝置的代碼……

Stable Diffusion 在任何應用程式中的一個關鍵問題是模型在哪裡運作,在應用程式中,相比于基于伺服器的方法,在裝置上部署 Stable Diffusion 模型更有優勢,原因有三條:首先,這能夠更好地保護終端使用者的隐私,因為使用者向模型輸入的任何資料都會留在使用者的裝置上;其次,在初始下載下傳後,使用者不需要網際網路連接配接就可以使用該模型;最後,在本地部署這個模型使開發者能夠減少或消除他們的伺服器相關成本……

為 Stable Diffusion 優化 Core ML 并簡化模型轉換,使開發者更容易以保護隐私和經濟可行的方式将這項技術納入他們的應用程式,同時在蘋果裝置上獲得最佳性能。該版本包括一個 Python 包,用于使用 diffusers 和 coremltools 将 Stable Diffusion 模型從 PyTorch 轉換到 Core ML,以及一個 Swift 包,用于部署這些模型。

值得注意的是,這一宣布分為兩部分:首先,蘋果對開源模型 Stable Diffusion 模型本身進行了優化;其次,蘋果更新了其作業系統,并針對蘋果自己的晶片進行了調整。

此外,似乎可以假設這隻是一個開始:雖然蘋果多年來一直在自己的晶片上搭載所謂的 “神經網絡引擎”,但這種人工智能專用硬體是根據蘋果自己的需求調整的,似乎未來的蘋果晶片(如果不是今年,可能是明年)也會為 Stable Diffusion 進行調整。同時,”Stable Diffusion” 本身也可以内置于蘋果的作業系統中,任何應用程式的開發者都可以很容易地獲得 API。

這就帶來了這樣的前景:“足夠好 “的圖像生成能力将有效地内置到蘋果的裝置中,是以任何開發者都可以使用,而不需要像病毒式流行的 Lensa(Lensa 是一個多合一的圖像編輯應用程式) 那樣需要忙着擴大後端伺服器的規模,最終赢家看起來像 App Store,蘋果公司赢在生态優勢,而小型獨立應用程式制造商則擁有 API 和分銷管道來建立新的業務。

另一方面,輸家将是像 Dall-E 或 MidJourney 這樣的集中式圖像生成服務,以及支撐它們的雲供應商(以及迄今為止支撐上述 Lensa 等 Stable Diffusion 應用程式的雲供應商)。雖然 Dall-E 和 MidJourney 都比 Stable Diffusion “好”,至少在我的估計中是這樣,蘋果裝置上的 Stable Diffusion 不會占領整個市場,但内置的本地能力将影響集中式服務和集中式計算的最終可處理市場。

二、亞馬遜

在圖像和文本生成這樣的 C 端場景中,亞馬遜的優勢似乎不太明顯,重要的是 AWS,它可以在雲中出售 GPU 的算力。

其中一些用于訓練,包括 Stable Diffusion, 根據 Stability AI 的創始人兼首席執行官 Emad Mostaque 的說法 ,該公司使用了 256 台 Nvidia A100,所有顯示卡總計耗時 15 萬小時,市場價格為 60 萬美元(這是個令人驚訝的低價),不過,更大的需求是推理,即實際應用模型來産生圖像(或文本,在 ChatGPT 的情況下),每次你在 MidJourney 中生成圖像,或在 Lensa 中生成頭像時,推理都是在雲端的 GPU 上運作。

目前英偉達 80GB 顯存的 A100 顯示卡售價約 1.7 萬美元,每張卡在雲計算平台租用約為 4 美元/小時。

Stable Diffusion 需要 256 張 A100 訓練,約 24 天,并向 AWS 支付 15 萬小時的價格,相比于動辄千億參數幾百上千萬美元開銷的語言生成模型,的确是很低的價格。

在過去兩年半裡,類似 GPT-3 等模型的訓練成本下降了 80% 以上,目前僅需要 140 萬美元(首次訓練開銷約為 1200 億美元),高性能大語言模型的訓練成本将進一步降低。

亞馬遜在這一領域的前景将取決于若幹因素:首先最明顯的是這些産品最終在現實世界中的實用性如何,除此之外,蘋果直接在終端生成 AI 也會對亞馬遜産生重大影響。好在亞馬遜本身就是一個晶片制造商:雖然它迄今為止的大部分努力都集中在其 Graviton CPU 上,但它可以為 Stable Diffusion 等模型建立的專用硬體,并在價格上競争,同時 AWS 和 Nvidia 建立了良好的合作夥伴關系。

AWS Graviton 是由 AWS 設計的基于 ARM 架構的 64 位CPU。第一代于 2018 年推出的,第二代産品于2019年12月推出,已在AWS EC2 執行個體中得到廣泛應用,産品目前已疊代至第三代。

AWS 與 NVIDIA 已合作超過 10 年,提供基于 GPU 的解決方案,從雲(使用 NVIDIA GPU 支援的 Amazon EC2 執行個體)到邊緣(使用部署了 NVIDIA Jetson Nano 子產品的 AWS IoT Greengrass 之類的服務)不等。

亞馬遜的短期大問題将是對于需求的衡量:他們目前沒有足夠的 GPU 滿足客戶的計算需求,但如果購買太多閑置的 GPU ,又會大大提高公司的營運成本。

更有挑戰的是:人工智能的挑戰之一是推理要花錢,換句話說,不同于傳統軟體,用人工智能做東西有邊際成本。

我認為在開發人工智能産品時邊際成本問題被大大低估了。

雖然雲服務一直都有成本,但 AIGC 可能會使它難以實作 product-market fit ,我并不認為 ChatGPT 對終端使用者是免費的,并可以由 OpenAI 的一家公司提供,實際上背後還有 Azure 的支援,OpenAI 不僅建立了自己的模型,還與微軟達成了計算能力的優惠協定,這并不是一個偶然,長遠來看,或許 AWS 不得不廉價出售 GPU 算力,才會刺激更加繁榮的生成式應用。

當然,随着時間的推移,這些成本應該會下降:模型會随着晶片的進步變得更有效,而市場上需求的繁榮會給雲服務帶來應有的規模回報。不過,除了上述蘋果在裝置端推理的可能性之外,AWS 長期同樣會受到全棧內建的模型供應商的影響,這一切都是不确定的。

對于模型供應商而言,AI 計算的需求不同于傳統上所說的“雲計算”:AI 訓練一般會占滿實體機,并不要求特别強的虛拟化,需要更高的性能和帶寬,同時很多任務是離線的。

換言之,對于以 Midjourney 為代表的既自己訓練模型又直接面向使用者的公司,未來未必會選擇公有雲平台,同時 AWS 在 AI 雲計算方面能力并不領先于微軟雲和谷歌雲。

三、Meta

在 Meta Myth 中,我詳細說明了為什麼對 Meta 來說,人工智能是一個巨大的機會,值得該公司巨額投資:

Meta 有巨大的資料中心,但主要是 CPU 叢集,用來支撐 Meta 基于确定性的廣告模型和網絡内容推薦算法業務。

不過,ATT(蘋果的透明跟蹤技術)的長期解決方案是建立機率模型,不僅要弄清楚客戶目标,還要了解哪些廣告轉化了,哪些沒有。這些機率模型将由大規模的 GPU 資料中心建立,一張 Nvidia 顯示卡成本為五位數,如果是過去那樣的确定性的廣告模型,Meta 并不需要投資更多的 GPU ,但技術在進步,Meta 需要面對全新的時代,在客戶定位和轉化率層面投入更多。

此外,基于機率模型的算法對網絡飛輪的持續增長至關重要:從網際網路中推薦内容比隻從你的朋友和家人那裡推薦内容要困難許多,特别 Meta 打算不僅推薦視訊,還推薦所有類型的媒體,并将其與你關心的内容穿插在一起,這種情況下,人工智能模型也将是關鍵,而建立這些模型需要花費大量資金購買裝置。

長遠看,關于顯示卡的投資能得到豐富回報:首先,更精準的客群定位和轉化率可以幫助 Meta 重新開機收入增長,其次,一旦這些人工智能資料中心建成,後續隻需要支付維護和更新成本,這遠低于其建造成本;第三,這種大規模投資是其他競争對手無法做到的,除了谷歌(不巧的是,谷歌的資本支出也将上升)。

ATT(蘋果的透明跟蹤技術) 對 Meta 的傷害比任何其他公司都大,因為後者是美國市場投放第一大平台,但從長遠來看,它會加深 Meta 的護城河:自建 AI 資料中心這種水準的投資對于像 Snap 或 Twitter 或數字廣告領域的任何失敗的競争者來說根本不可行,一方面是 Meta 的廣告算法水準會和其他競争對手(谷歌除外)拉開差距,另一方面是由于自建資料中心它的費用又可以大大降低,到最後廣告商往往别無他選。

2021年 4 月 26 日,蘋果“應用追蹤透明” (App Tracking Transparency,簡稱 ATT) 隐私采集許可新政正式實施,使用者可以有權利自主選擇是否被應用開發者追蹤的自主權利,即模糊歸因了廣告的投放效果。

在 ATT 之前, 可以從内部收集資料廣告商的應用和網站,非常确定哪些廣告導緻了哪些結果。這反過來又讓廣告商有信心在廣告上花錢,不在乎成本投入,而是着眼于可以産生多少收入。ATT 切斷了 Meta 廣告與轉化之間的聯系,将後者标記為第三方資料并是以進行跟蹤。這不僅降低了公司廣告的價值,還增加了廣告轉化的不确定性。

蘋果政策釋出當日,Facebook 股價應聲下跌 4.6%。

讓 Meta 的人工智能發揮作用的一個重要因素,不是簡單地建立基礎模型,而是不斷地針對個别使用者進行調整,這是最複雜的一部分,Meta 必須弄清怎麼低成本地提供個性化使用者服務,同時 Meta 的産品也愈發內建化,它們不僅宣布自研 VR 裝置晶片, 還打算自研伺服器晶片,并釋出上層 AI 軟體工具以簡化 Nvidia 、AMD 晶片之間的切換,同時也在開發自己的 AI 晶片。

長遠來看,雖然 Meta 之前投資人工智能的主線是個性化推薦,但這些與生成模型 2022 年的突破相結合,最終歸宿是個性化内容,這些内容将會通過 Meta 的管道。 正如薩姆-萊辛(Sam Lessin)曾說:算法的終局是 AIGC,我在談到 Metaverse 時也表達了類似的觀點。

目前,看 Meta 的廣告工具如何發展将很有趣:生成模型和 A/B 測試的整個過程都可以由人工智能完成,在大規模提供這類能力方面,Meta 是上司者。從業務角度來說,Meta 的廣告更側重于吸引消費者的眼球,更追求浏覽量而非高效地轉化,這也意味着有很多疊代的空間,也很友善人工智能技術切入,縱然上文提到第一代人工智能産品可能有邊際成本,但這些成本已經遠低于人類。

Meta 從 2013 年便開始大規模投入 AI 研究,由神經網絡提出者 Yann LeCun 主導成立的 FAIR,在很長一段時間裡和 DeepMind、OpenAI 并肩走在時代前列,2022年1月,FAIR 并入 Reality lab 成為下屬子部門。

近一年 Meta 在生成模型層面進展加速:

  • 2022年 1 月釋出語音生成模型 Data2vec,該模型可以以相同的方式學習語音,視覺和文本,并于2022 年釋出Data2Vec2.0,大大提高了其訓練和推理速度;
  • 2022年 5 月釋出開源的語言生成模型 OPT(Open Pre-trained Transformer),同 GPT3 一樣使用了 1750 億參數,并于2022年 12月 釋出其更新版本OPT-IML,還将為非商業研究用途免費開放;
  • 2022年 7 月釋出圖檔生成模型 Make-A-Scene;
  • 2022年 9 月釋出視訊生成模型 Make-A-Video;
  • 2023年 1 月釋出首個 4D 場景生成模型 Make-A-Video3D,直接從文本描述中生成 3D 動态場景;

在 2022 财年報告上,紮克伯格說,Meta計劃将新技術內建到幾乎所有産品中,例如生成圖像,視訊,頭像和 3D 資産,營銷人員可以使用生成式人工智能來幫助他們的付費文章提供書面副本或建立圖像和視訊,從 2022 年 Q3 季度财報至今,Meta 股價已經翻了一番(如下圖所示):

ChatGPT:受驚駭的巨頭們與焦慮中的軍備競賽

四、谷歌

《創新者的窘境》出版于 1997 年,當年柯達的股票達到了 94.25 美元的最高價,從技術看起來十分合理:柯達公司不僅主導了膠片技術,還發明了下一個浪潮産品:數位相機;但問題出在了商業端:鹵化銀膠片利潤率非常高,讓柯達賺了很多錢,但數位相機不需要膠片。當年柯達的管理層非常有動力說服自己:數位相機永遠隻适合業餘愛好者,還需要等它們成本降下來,這需要很長的時間。

其實柯達的管理層是對的:從數位相機的發明到數位相機的銷售超過膠片相機的銷售,花了 25 年多的時間;而數位相機在專業領域的應用,則花了更長的時間。在此期間,柯達賺了很多錢,并支付了數十億美元的分紅,雖然該公司在 2012 年破産,但這是因為消費者有機會獲得更好的産品:首先是數位相機,最後是内置相機的手機。

除了這種快樂的結局,還有另一種相反的觀點:大多數人認為柯達是一個失敗,因為我們期望公司能夠永遠活着。在這種觀點中,柯達是一個警示,說明一個創新的公司如何因為商業模式導緻最終滅亡,即使消費者在公司覆滅的過程中得到更好的東西。

是以,今天看谷歌和人工智能,谷歌發明了 Transformer 模型,這是支撐大模型浪潮的關鍵技術。據傳聞,谷歌有一款對話聊天産品,效果遠優于 ChatGPT,同時谷歌聲稱其圖像生成能力比 Dall-E 或市場上的任何其他人都要好,然而,這些都隻是說法,市場上沒有見到實際産品。

2022 年 12 月,谷歌 CEO 宣布内部拉響“紅色警報”以應對來自 Chat GPT 的挑戰,2023 年 1 月 21 日,紐約時報報道已經退出日常工作的谷歌創始人 Larry Page 和 Sergey Brin 受現任 CEO 邀請回公司參加 AI 戰略和産品會議,總共約 20 個項目将在 23 年推出。

2023 年 2 月 6 日谷歌母公司 Alphabet 的首席執行官桑達爾·皮查伊發文稱,該公司将推出一項名為 Bard 的對話式人工智能服務,Bard 将由谷歌開發的大型語言模型 LaMDA 驅動。22 年 5 月時,一名谷歌軟體工程師公開宣稱這一人工智能是“有感覺力的”,這一引發争議的說法後來受到了審查。

從技術儲備層面講,谷歌是領先于 OpenAI 的,隻不過很多前沿進展沒有和業務結合:

• 生成模型端:

▫ 對話模型 LaMDA;

▫ 目前最大的參數量(5400億)通用語言生成模型 PaLM;

  • Ⅰ. 2022年8月,PaLM-saycan,具身機器人,基于機器人動作序列資料集;
  • Ⅱ. 2022年12月,Med-PaLM,醫療機器人,基于醫療領域資料集;
  • Ⅲ.(正在開發)PaLM-Coder 2,代碼生成工具;

▫ 圖像生成模型 Imagen;

▫ 音樂生成模型 MusicLM。

• AI 系統端:

▫ 大模型訓練系統 Pathway 平台;

▫ 自研 Tensorflow 和 Jax 架構;

▫ 谷歌雲和 TPU 晶片。

同時 Google 于 2022 年底向 OpenAI 競争對手 Anthropic 投資 3 億美元,投資條款類似微軟投資 OpenAI,包括要求 Anthropic 使用谷歌雲的算力,以及從 Pytorch 切換至 JAX 架構。Anthropic 團隊主要來自 OpenAI,自稱“是一家人工智能安全和研究公司,緻力于建構可靠、可解釋和可操縱的人工智能系統”,近期内測了一款名為 Claude 的智能聊天機器人,據稱在多項名額上優于 Chat GPT。

2 月 8 日,谷歌在 Google presents : Live from Paris 大會上首次展出 Bard ,但整場釋出會沒有過多關于 Bard 的内容,還在展示的 Demo 中犯了事實性錯誤,當日股價下跌 3%,作為對比,微軟股價上漲 6% 。

長期以來,谷歌一直是 AI 領域的上司者,他們使用機器學習技術不斷優化搜尋産品和其他消費者服務産品,并通過谷歌雲将該技術作為一項服務提供。不過,搜尋一直依賴于人類作為最終的仲裁者,谷歌隻提供連結,最後需要通過使用者選擇正确的連結,這也延伸到了廣告。在二十年前,谷歌的服務是革命性的,它首創了依據點選量收費的商業模式,颠覆了傳統的隻依靠模糊印象的品牌性廣告投放方式。

2015 年,我在《谷歌和戰略的局限性》一文中寫到了這對谷歌在人工智能世界中的業務帶來的難題:

在昨天的主題演講中,谷歌首席執行官桑達爾-皮查伊 (Sundar Pichai) 在回顧了 PC -網絡-移動時代的科技曆史之後,宣布我們正在從一個 Mobile-first 的世界轉向 AI-first 的世界,順勢推出了谷歌助理。

一年以後蘋果 iOS 6 則首次以 Siri 的名義引入了助手的概念,你第一次可以(理論上)通過語音進行計算,起初它的效果并不好(可以說現在也是如此),但它對計算機和谷歌的具體影響是深遠的:語音互動擴大了計算的範圍,盡管有一定限制,但它把你的眼睛和雙手從裝置中解放出來。AI 助手必須比搜尋結果頁面更加積極主動,僅僅提供可能的答案是不夠的,相反,它們需要給出正确答案。

這是谷歌技術的一個可喜的轉變,從一開始,搜尋引擎就包括一個 “我感覺很幸運 “的按鈕,谷歌創始人拉裡-佩奇對搜尋引擎能夠提供你想要的确切結果如此有信心,雖然昨天的谷歌助理示範是有劇本的,但它在涉及上下文感覺時候,比市場上的其他助理更驚豔,延申開來,當涉及到作為其助手基礎的 AI 技術時,谷歌是公認的上司者。

不過,一個企業不僅僅是技術問題,特别是在涉及到 AI 助手時,谷歌有兩個重大缺陷:首先,該公司缺少一個終端的入口 :助手隻有在可用的情況下才有用,對于數以億計的 iOS 使用者來說,這意味着下載下傳和使用一個單獨的應用程式(或者建立像 Facebook 那樣的體驗,使用者會願意花大量的時間)。其次,如果使用者不必從搜尋結果中進行選擇,便沒有機會點選廣告,這對于 Google 現有商業模式有很大沖擊。

當年那篇文章結論導向谷歌助理将內建入谷歌手機作為獨家入口,現在看是錯的,但基本的分析仍然有效。在過去七年裡,谷歌的主要商業模式創新是将更多的廣告塞進搜尋中,這在移動端尤其有效。而且坦率地說,谷歌掙錢最多的那種搜尋:旅遊、保險等,都不太适合聊天界面。

是以谷歌的管理層可能需要越來越擔心,在特定的搜尋場景中,生成式 AI 代表的是颠覆式創新而非漸進式創新。而在開始的時候,颠覆性創新往往不如現有的産品好,是以它很容易被谷歌的經理們駁回,來避免思考商業模式的挑戰。但颠覆性的産品注定會變得更好,同樣的目前産品會變得越來越臃腫和難以使用,聽起來好像谷歌搜尋目前的軌迹。

我沒有說谷歌注定會衰落,我以前也這麼說過,但錯得離譜,谷歌也有它的雲計算,YouTube 的主導地位依舊在強化,但搜尋業務似乎已經抵達巅峰似乎很清楚,即使多年來它保持着豐沛的現金流,貢獻了海量利潤。

五、微軟

微軟似乎是所有公司中生态位最好的,像 AWS 一樣,它有一個銷售 GPU 的雲服務,它也是 OpenAI 的獨家雲供應商,這些投資都是令人難以置信的昂貴 ,但鑒于 OpenAI 似乎有成為這個時代最強人工智能公司的潛質,是以這些基礎設施的投入都是值得的。

• 2019 年,微軟向 OpenAI 投資 10 億美元,其中包括要求其雲計算平台從谷歌雲遷移至 Azure,這十億美元很大一部分是以雲計算積分形式進行,根據 The Information 檢視的資料,

公司在截至 2019 年年中的财年中,即在獲得微軟投資之前的一整年中,在微軟産品上花費了 84.5 萬美元,在微軟投資後的第一個完整年度,OpenAI 在扣除信用額度後僅大約花費了 5.2 萬美元。

• 2022年,微軟計劃對 OpenAI 追加 100 億美元的投資,這筆資金還包括其它風險投資機構:

▫ 投資後微軟将獲得 OpenAI 的 75% 利潤,直到它收回投資,在這之後微軟将獲得 OpenAI 49%,其他投資者獲得另外 49% 的股份,OpenAI 的非營利性母公司獲得 2% 的股份。

▫ 盈利後的 OpenAI 的利潤配置設定将按照以下四個階段進行:

  • 第—階段将優先保證埃隆馬斯克、彼得泰爾、雷德霍夫曼等首批投資者收回初始資本;
  • 第二階段,微軟将有權獲得 OpenAl 的利潤,直至收回其 130 億美元投資;
  • 第三階段,在 OpenAI 的利潤達到 920 億美元後,微軟在該公司的持股比例将下降到 49% , 剩餘 49% 的利潤由其他風險投資者和 OpenAI 的員工分享;
  • 第四階段,在利潤達到 1,500 億美元後,微軟和其他風險投資者的股份将無償轉讓給 OpenAI 的非營利基金。

與此同時,Bing 就像 iPhone 前夕的 Mac 一樣:它确實貢獻了相當多的收入,但這些隻占了微軟整體份額的一小部分。而 Bing 搜尋引擎與 Chat GPT 的結合,從搜尋引擎的視角看是一個比較有風險的商業模式,但這樣一個挑戰 Google 的機會,值得一搏。

2023 年 2 月 8 日,微軟釋出 GPT-4 支援的 Bing 和 Edge 浏覽器,新版 Bing 除了傳統搜尋展示的網頁連結,還會在網頁右側直接給出答案。

CEO 薩提亞·納德拉在釋出會後的一場專訪上對媒體表示,自十五年前的雲計算浪潮之後,AI 是少有的能讓他如此興奮的新技術。他還強調,AI 加持的搜尋引擎,是他在任 CEO 9 年來微軟公司“最重要的産品”。

關于搜尋成本的計算:

  • 理論層面目前推算單次搜尋成本為 0.5 美分,谷歌日均 10 億次搜尋,目前市場占有率 91%,引入聊天機器人後可能會使成本提高 1-2 倍,大概占 Google 年營收 15%–25%;
  • 未來通過模型蒸餾、系統優化、晶片提升等三個次元的技術進步,該成本有望每半年下降一半以上;
  • 但 Bing 本次的示範表明實際産品中的搜尋成本并不是簡單的一次搜尋和一次生成的成本相加,而是有機的結合,具可靠資訊:本次示範的 Bing 的搜尋成本比 Google 高 2 個數量級。

同時, 來自 The Information 的最新報道稱,GPT 最終将進入微軟的生産力應用程式,代碼生成工具 GitHub Copilot(它建立在 GPT 之上)的成功,讓它找到了一個很好的創新點。

2023 年 2 月 2 日,微軟 CEO 薩蒂亞·納德拉(Satya Nadella)透露,計劃将 ChatGPT 等人工智能工具整合到旗下所有的産品中,包括且不限于 Bing 搜尋引擎、Office、Azure 雲服務、Teams 等,并将其作為平台提供給其他企業使用。

未來我們可以享受的服務:

  • 我們可以通過 VS code 訂閱 Github Copliot 産品輔助程式設計;(VScode 和 Github 均為微軟旗下産品);
  • 可以使用內建了 ChatGPT 的搜尋引擎;
  • 在終端零成在本地享受內建了生成模型的 Windows 系統和 Office 套件;
  • 可以在 Azure 雲服務上調用 GPT 和 DALL-E 系列;
  • 可以在 Teams 上享受 ChatGPT 助理的輔助辦公。

重要的是,增加新的功能,與微軟的訂閱商業模式完全相符,令人感慨的是,這家公司曾被認為是颠覆式創新受害者的典型代表,但現在來看,它們反而借助颠覆式技術抵達了更高的平台。

過去十年微軟的股價上漲 9 倍,标普 500 指數上漲約 4 倍,而曾經的颠覆式創新者 Google 上漲僅 4 倍。

ChatGPT:受驚駭的巨頭們與焦慮中的軍備競賽

六、英偉達

最大的赢家可能是 Nvidia 和台積電,Nvidia 對 CUDA 生态系統的投資意味着該公司不僅擁有最好的人工智能晶片,還擁有最好的人工智能生态系統,它們目前正在投資擴大該生态系統的規模 。當然,這同樣來自谷歌的 TPU 等内部晶片的競争,不過,至少在可預見的未來,所有人都将在台積電制造他們的晶片。

英偉達資料中心的業務在 2023 年 Q1 正式超越遊戲業務成為第一大業務,據其 2023 财年第三季度财報顯示:資料中心業務同比增長 31% 達到 38 億美元,而遊戲業務收入下降 51% 至 16 億美元;

目前在資料中心 GPU 領域,英偉達壟斷地位甚至強于消費端:

  • 市占率常年穩定在 80% 附近,據 Top500.Org 資料顯示:英偉達 GPU 産品在全球 Top 500 超算中心的滲透率逐年提高,由 2013H1 的 72.2% 提升至 2021H2 的 90.3%,研究文獻中引用英偉達 GPU 的次數是頂級AI晶片初創公司總和的 90 倍;
  • 同時其 CUDA 生态開發開發者在過去兩年翻了三倍到接近 350 萬,形成了強大的軟體生态護城河,并不會擔心來自谷歌 TPU 等專用 ASIC 晶片的競争;
  • 目前人工智能領域的算力需求約每 3.5 個月翻一倍,導緻其晶片常年供不應求,即使最新一代 H100 晶片已經釋出,上一代晶片 A100 市場價較釋出初期依舊有所上漲,這在硬體端是極不尋常的事情;
  • 繼摩爾定律後,英偉達 CEO 黃仁勳提出黃氏定律:每 12 個月 GPU 性能翻一倍,且不受實體制程限制。

不過,摩根斯坦利最近的報告認為:長期訓練用硬體的增長速度會比較平穩,正在開發的語言模型大小預計不會更快增長。

另外,推理成本是一個高估的數字,市面上的計算都是基于 A100 的成本進行推測,但 A100 不是推理專用晶片。Azure 在雲産品中建議推理工作應該運作在 Nvidia T4 上,硬體成本比 A100 低 80%,功率效率更高,是以預計每次推理成本未來會迅速降低。

由于英偉達沒有在推理端壟斷,這指向了一個新的兵家必争之地——更具成本效益的新型架構 AI 推理晶片,AMD、Intel 和創業公司都有機會。推理市場可能比訓練市場更具前景。

關于人工智能的潛在影響,還有很多東西要寫,但這篇文章已經夠長了,從新公司的角度來看,OpenAI 顯然是最有趣的:OpenAI 有可能成為所有其他人工智能公司賴以生存的平台,這将最終意味着 OpenAI 之外的人工智能的經濟價值可能相當有限。

還有另一種可能性,即除了圖像生成之外,開源模型在文本生成領域也會激增,在這個世界上,人工智能成為一種基礎設施:這可能是對世界影響最大的結果,但沖突的是,對單個公司的影響很弱,是以我懷疑最大的機會将出現在那些最在乎确定性的行業:因為該行業的傳統公司很難給予基于機率統計的人工智能技術以充足的投資,正如當年柯達不會給予基于數字圖像的數位相機技術以充足的投資一樣,但也同當年數字技術一樣,人工智能技術在飛速發展。

最大的影響也可能是在我們的雷達之外, 納特·弗裡德曼在 Stratechery 采訪中告訴我 Riffusion ,它使用 Stable Diffusion 法通過視覺聲波圖從文本中産生音樂,這讓我想知道當圖像真正普及開後還有什麼可能。文本是通用的界面 ,因為自文字發明以來,文本一直是資訊傳遞的基礎,然而人類又是視覺動物,人工智能在圖像的創造和解釋方面的可用性可能會從根本上改變傳遞資訊的方式,這也是無法預測的。

目前,我們的預測必須受到更多的時間限制,而且要适度,這或許是人工智能時代的開始,但即使在科技領域,時代也需要十年或更長時間來改變周圍的一切。

Reference

1.原文連結:AI and the Big Five – Stratechery by Ben Thompson

https://stratechery.com/2023/ai-and-the-big-five/

2.《創新者的窘境》

http://claytonchristensen.com/books/the-innovators-dilemma/

3.廣告業務的護城河

https://abovethecrowd.com/2011/03/24/freight-train-that-is-android/

4.《戰略信條》

https://www.joelonsoftware.com/2002/06/12/strategy-letter-v/

5.Stable Diffusion 可在 Iphone 上運作

https://stratechery.com/2022/lensa-and-stable-diffusion-stable-diffusion-and-apple-silicon-open-questions/

6.蘋果公司模型優化

https://machinelearning.apple.com/research/stable-diffusion-coreml-apple-silicon

7.Stability AI 的創始人兼首席執行官 Emad Mostaque 發言

https://twitter.com/EMostaque/status/1563870674111832066

8.Meta Myth

https://stratechery.com/2022/meta-myths/

9.自研 VR 裝置晶片

https://stratechery.com/2022/metas-chip-decision-horizon-worlds-platform-fees-metas-missing-metaverse-strategy/

10.上層 AI 軟體工具

https://www.reuters.com/technology/meta-launches-ai-software-tools-help-speed-up-work-blog-2022-10-03/

11.算法的終局是 AIGC

https://stratechery.com/2022/instagram-tiktok-and-the-three-trends/

12.Metaverse 訪談

https://stratechery.com/2022/dall-e-the-metaverse-and-zero-marginal-content/

13.谷歌和戰略的局限性

https://stratechery.com/2016/google-and-the-limits-of-strategy/

14.谷歌的缺陷:終端入口

https://stratechery.com/2016/googles-go-to-market-gap/

15.谷歌的未來

https://stratechery.com/2014/peak-google/

https://stratechery.com/2019/the-google-squeeze/

16.微軟獨家雲供應商

https://www.theinformation.com/articles/why-openai-spent-barely-a-dime-on-microsofts-cloud-after-1-billion-deal

17.The Information 最新報道

https://www.theinformation.com/articles/ghost-writer-microsoft-looks-to-add-openais-chatbot-technology-to-word-email

18.英偉達人工智能生态系統

https://stratechery.com/2022/nvidia-in-the-valley/

19.Top500.Org

20.納特-弗裡德曼在 Stratechery 的采訪

https://stratechery.com/2022/an-interview-with-daniel-gross-and-nat-friedman-about-chatgpt-and-the-near-term-future-of-ai/

21.Riffusion

https://arstechnica.com/information-

technology/2022/12/riffusions-ai-generates-music-from-text-using-visual-sonograms/

22.文本是通用的界面

https://scale.com/blog/text-universal-interface

https://stratechery.com/2022/the-ai-unbundling/

23.其他參考連結

https://mp.weixin.qq.com/s/cvzlLPg0cNMtybvfbNqmSQ

https://stratechery.com/2023/ai-and-the-big-five/

https://a16z.com/2023/01/19/who-owns-the-generative-ai-platform/

https://sunyan.substack.com/p/the-economics-of-large-language-models

https://mp.weixin.qq.com/s/oM0V0MymMbanJddzABYDDQ

https://stratechery.com/2022/meta-myths/

https://aws.amazon.com/cn/free/machine-learning/

作者:拾象;公衆号:海外獨角獸

原文連結:https://mp.weixin.qq.com/s/TtUX5FYNZL5BMICOV3wdYQ

本文由 @海外獨角獸 原創釋出于人人都是産品經理。未經許可,禁止轉載。

題圖來自 Pexels,基于CC0協定。

該文觀點僅代表作者本人,人人都是産品經理平台僅提供資訊存儲空間服務

繼續閱讀