天天看點

雲計算一哥,再一次預判了行業

作者:虎嗅APP
雲計算一哥,再一次預判了行業

題圖|視覺中國

在以“服務”為核心的雲計算行業,客戶最多的企業,對市場的感覺通常最敏銳,也最可能成為其他廠商跟随的對象。這種情況在亞馬遜雲科技身上屢屢發生,直到生成式AI爆火。

人們突然覺得,雲計算市場的絕對一哥,這一次好像沒有在技術上取得領先。智能時代會重新洗牌嗎?亞馬遜雲科技會成為被新技術折疊掉的又一個巨頭企業嗎?種種猜測甚嚣塵上。而事實證明大家多慮了——即使全球數百個大模型開啟混戰時,亞馬遜雲科技依然把核心放在服務上。況且在技術上的投資也收獲了成效,Claude 3釋出後,也沒人再質疑亞馬遜雲科技在AI層面的底層能力。

而與微軟Azure的Copilot政策不同的是,亞馬遜雲科技的更新ToB色彩更重,也更适配公有雲場景。在亞馬遜雲科技的定義下,今天雲計算的“服務”概念,在生成式AI場景中發生了變化,它逐漸演化成三個次元:對最新硬體性能的充分利用;對大模型技術更新的充分利用,同時規避行業動蕩的風險;充分适應生成式AI時代的全新應用思維。

這使得亞馬遜雲科技在某種程度上形成了對微軟Azure的差異化競争優勢。

以“服務”的概念封裝硬體産業

目前硬體市場,企業的經營者正在為硬體更疊問題而發愁。

這一切,或多或少都源于英偉達的聰明勁,它敏銳地捕捉到大模型引發的成本問題,也是以拒絕将客戶的采購理由,僅僅限定為“新卡性能更強”。

實際上,除了在全球占據主導的幾家基礎模型研發廠商,以及在科研領域主攻氣象、制藥的機構和巨頭,大部分客戶并未迎來暴漲的算力需求,其收入也還沒到以年為機關大規模疊代 GPU的地步。是以,每年GTC所引導的一個關鍵話題是,新卡的能耗,以及随之而來的訓練成本在快速降低。以2024 GTC釋出的GB200 NVL72,推理性能提升了30倍,很厲害,但在筆者看來,成本和能耗降低25倍,這更有誘惑力。

此外,英偉達高達90%以上的市占率并未導緻其受到太多反壟斷調查,一個核心原因是,目前晶片市場的競争仍然客觀存在。谷歌、英特爾、高通等企業聯合成立了UXL基金會,決定先攻破英偉達圍繞CUDA建立的軟體護城河。而AMD自去年至今,都以MI300為主力,試圖正面挑戰英偉達。從更長遠的視角來看,方舟基金“木頭姐”認為英偉達存在風險,很像二十年前的Cisco。結果就在4月19日,英偉達大跌10%。

某種意義上,這強化了基于GPU算力孵化創新業務的不安感——使用舊卡的ROI在快速降低,風險卻在快速提高,誰都說不好明年會是哪家企業,突然放出一個勁爆消息。且一但進入“買卡創業”的模式,該AI項目馬上變成重資産屬性,進一步加劇了風險。

企業的焦慮,通常也是雲計算的機會,雲計算習慣将一切都看做“服務”。是以,亞馬遜雲科技圍繞底層算力構築,做了完整的布局。

首先,亞馬遜雲科技作為英偉達的頭部客戶,雙方在品牌上高強度綁定。黃仁勳出現在了去年的亞馬遜雲科技re:Invent上,而亞馬遜雲科技CEO Adam Selipsky則出現在了GTC 2024 上,且重點談及了雙方超過13年的合作曆程。而且亞馬遜雲科技也很快官宣提供基于NVIDIA Grace Blackwell GPU的Amazon EC2執行個體、首款搭載英偉達Grace Hopper超級晶片的雲AI 超級計算機,以及首款采用英偉達GH200 NVL32的NVIDIA DGX cloud。

但另一方面,亞馬遜雲科技也并未把雞蛋都放在一個籃子裡。最新的亞馬遜雲科技自研的用于AI訓練Trainum 2,以及用于AI推理的Inferentia 2,都已經釋出。前者可以支援千億級甚至萬億級參數規模模型訓練,用于引導大規模并行計算的UltraClusters也已經相當成熟。

亞馬遜雲科技大中華區産品部總經理陳曉建透露,UltralClusters可以支援最多10萬多個最新的Trainium2進行并行訓練。這不禁讓人想起NVLink和NVSwitch,在單塊晶片的性能逼近晶圓的實體極限後,這種叢集場景下的連接配接與編排能力,變得相當重要。單個晶片,不足以讓人對亞馬遜雲科技屏蔽硬體行業動蕩的“服務”放心,但加上UltralClusters後或許可以。

在硬體層面,亞馬遜雲科技關注的是創業公司的焦慮核心,用雲模式代換掉了重資産模式,屏蔽生成式AI基礎設施建構的複雜一面。雲計算公司,做的始終是服務,而不是技術,這是當人們試圖了解亞馬遜雲科技時,必須要謹記的重點。

“貨架”才是GenAI B端市場最好的進入形态

這種對服務的貫徹,脫開IaaS層,進入PaaS層後,變得更加明顯。

業内自2023年開始,模型釋出的新聞版式一直相當固定:我們釋出了xxx LLM,參數規模xxx,性能逼近或超越了GPT-3.5/GPT-4。

而在亞馬遜雲科技向Anthropic投資40億美金後,Anthropic卻掏出了一個與以上通用版式截然不同的答卷:Anthropic釋出了Claude 3大模型,但包括三個版本——Opus、Sonnet和Haiku,三者性能存在顯著差别,按從高到低排列。陳曉建表示,客戶可以根據自己的商業需求,從中選擇最合适的智能、速度和價格組合。Opus是智能水準最高的模型,最适合複雜的開放式場景;Sonnet兼具智能和速度,适用于絕大部分場景;Haiku最具成本效益的模型,适用于大容量用例。

簡單地說,Haiku性能最低,多項評測落後于GPT-4,但它便宜啊。

這實在是個再典型不過的,關于“服務”概念的呈現。

還不止于此,在PaaS層,亞馬遜雲科技精準命中了太多的痛點問題。比如,當下其實還不存在,一個在所有場景中性能、ROI表現都是第一的通用模型。Claude 3 Sonnet在“多語言數學”次元得分勝過GPT-4,但在“數學問題解決”次元的得分又低于GPT-4。當涉及到具體應用場景時,問題可能變得更加複雜。

這為亞馬遜雲科技建構Amazon Bedrock提供了絕佳的角度。

作為中間工具層的重點,Amazon Bedrock讓使用者能夠輕松接入來自AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI以及亞馬遜等公司的27個領先基礎模型。當然,Bedrock也可以導入自己的定制模型,這一方面是為了增加靈活性,另一方面也是考慮到産業現階段的模型應用進展。

亞馬遜雲科技在大模型白熱化競争的階段,創造性的建構了一個“大模型貨架”的概念,企業選用大模型,有點像挑不同口味的樂事薯片,使其再一次在保持對Azure的壓迫感的同時,創造了差異化的競争優勢。

仔細想想就知道了,無論是希望在生成式AI趨勢裡,進行創新創業的公司,還是希望利用AI 能力完成對業務智能化改造的公司,這都更符合邏輯。

對于前者而言,當下對于生成式AI的認知,仍然存在障礙。比如Stable Diffusion不屬于LLM,這違背很多人對所謂大模型的籠統認知(何況産業自己對這一系列概念的定義也是模糊的)。這種認知障礙,最終會轉化為人力成本,映射在公司的項目進度中。除非以“服務”的模式,做好封裝與屏蔽。

對于後者來說,一家企業的不同業務部門可能都需要生成式AI的能力,但單個團隊的規模卻不大。在中國市場,超過300人規模的公司,即被定義為大型公司。而在一個所謂的大型公司内,研發團隊可能隻有50人,設計團隊隻有10人,市場團隊甚至還不足10人。無論單獨引入哪一種模型,服務上述側重完全不同的團隊,都有點得不償失。

最後,當下還沒有一家大模型可以拍着胸脯說,自己有絕對的競争優勢。OpenAI曾出現劇烈“宮鬥”;Stable.AI被曝謀求出售;李彥宏表示開源模型終将被閉源模型擊敗,但随後又被Llama 3射出的“回旋镖”擊中。一系列動蕩顯示這個市場遠未到達穩定态,它的競争劇烈又隐形,任何預判都有失效的風險。在非雲環境引入一款大模型,組建技術團隊特别訓練、精調,一旦出現變動,損失将是巨大的。

總而言之,“大模型貨架”在這裡是必須的,它不是個營銷概念,而是個産品概念。

在“貨架”的概念外,亞馬遜雲科技正在快速完成對客戶需求的抽象和産品化。他們推出了Model Evaluation,支援對模型效果自動評估和人工評估,以免當下未統一的測試标準誤導企業決策者,也防止一些針對某個測試集做定向優化的企業擾亂市場;他們推出了Guardrails,以保證大模型的輸出内容合規。

他們甚至連當下最大的熱門場景:圖像生成,也考慮到了。亞馬遜雲科技推出了Titan Image Generator,可以根據提示詞生成圖像,并且包含隐藏水印,支援水印檢測。

亞馬遜雲科技的這種判斷,很大程度上基于對客戶的極端關注和了解。有業内人士透露,亞馬遜雲科技的曆年産品釋出,受戰略規劃影響較小,受客戶回報影響較大。這與後來的新興軟體企業Datadog(解決微服務架構下的可觀測問題)幾乎一緻——Datadog的産品疊代,完全自包含數萬客戶的Slack使用者組内産生。某種程度上,這成了老牌和新興頭部公司的一種“内功心法”。

在雲計算的直接戰場外,這種PaaS層服務的加碼,也間接打死了一批妄圖成為大模型內建商的競争對手,進而進一步拓展了亞馬遜雲科技的競争縱深。今天的OpenAI從技術次元在對一些小企業完成折疊,而亞馬遜雲科技則在服務的次元進行折疊。直接導緻大模型市場開辟一年後,已經不存在事實上的“Easy Money”,“創新”成為了最重要的競争力。

埋葬舊時代的SaaS服務

那麼,誰将在接下來的創業潮中,擁有至關重要的創新能力?

這沒人可以斷言,按目前行業内專家共識邏輯,任何當下對生成式AI SaaS應用的認知,都受到移動網際網路時代固有的思維定式影響,都不是原生的AI SaaS。

唯一可以确定的是,當新的原生SaaS出現時,一定會埋葬一批舊有SaaS。

在對外宣傳上,亞馬遜雲科技将Amazon Q定義為企業級生成式AI助手,可以連接配接到公司資料、資訊和系統,可以根據客戶的業務定制Amazon Q,企業中的營銷人員、項目經理以及銷售代表等,都可以利用Q進行定制對話、解決問題、生成内容、采取行動,等等。許多人将其定義為2023 re:Invent上最有分量的釋出。

這是因為Amazon Q上融合着太多不同産品的特質——它是Copilot,可以生成并解釋應用程式代碼,并為代碼包、存儲庫和架構更新草案和文檔;它也是過去幾年經常被提及的數字員工,比如公司可以通過Web應用程式要求Q分析使用者在使用哪些功能時遇到了問題、應該如何改進這些功能。在亞馬遜雲科技内部的定義中,Amazon Q的概念比AI Agent更高階、更寬泛。

某種程度上,雲服務的呈現模式,自Amazon Q出現,已經開始分化出截然不同的路線。Amazon Q幾乎為舊時代低代碼、零代碼的“墳墓”埋上了最後一鏟土,同時也讓為企業定制數字員工的業務變得岌岌可危。

核心在于,在智能時代,你是将生成式AI的互動能力,當做一個産品,簡單賣給使用者,還是當做一個服務,打包呈現。前者更為主流,但盈利能力堪憂,流量成本較移動時代高出十倍不止;後者看起來更合理,但需要有足夠多的場景,能将商業閉環在其他産品上。

無論如何,Amazon Q的未來發展,恐怕很快将迎來階段性的結論。随着對模型參數的追求、對硬體成本的控制逐漸達成平衡,技術體系逐漸穩定,服務的概念将越來越多的影響B端市場競争格局。

繼續閱讀