天天看點

算力晶片和租賃價格“雙降”

作者:休閑荒野
算力晶片和租賃價格“雙降”

智算中心大批投建,專家提醒警惕“AI過熱”

作者/ IT時報記者 毛宇

編輯/ 郝俊慧 孫妍

2024年春節後,中國算力市場正經曆深度轉型與結構調整。

原本火爆的大模型賽道因高昂的投入及融資壓力呈現降溫趨勢,不少初創公司由于難以承受大模型訓練所需的巨額開銷,紛紛轉向更具潛力與針對性的垂直賽道,如政務模型、自動駕駛、醫療放射等細分領域。

“目前市場還是将AI炒得過熱,不少中小廠商已在通用大模型的巨額投資成本門前倒下,我們需要警惕出現早些年前光伏産業産能過剩的情況,今年應該尋求一個新的突破點。”山海引擎COO彭璐向《IT時報》記者表示。

算力底座——GPU,仍是當下算力市場的關鍵詞。

二手市場上,英偉達系列晶片算力價格近期出現明顯下滑,較春節前下降約10%,顯示出市場需求端的變化。進入4月以來,同花順算力租賃概念指數連續下跌,截至4月23日發稿,跌幅超16%。

一名業内人士向《IT時報》記者表示,“這一波智算中心投建之後,市場競争已基本充分,算力價格不會太離譜。”

算力晶片和租賃價格“雙降”

小算力營運商玩不動了

盡管大型科技公司産品,如百度的文心一言、阿裡的通義千問等在大模型領域仍保持較高投入,但市場普遍認為,随着算力成本飙升,隻有極少數具備強大資金實力的企業能夠支撐如此龐大的開支。此外,國内諸如MiniMax、月之暗面等公司的高額融資背後,折射出行業競争加劇以及商業模式探索的壓力。

公開資料顯示,MiniMax、月之暗面背後均有阿裡入股。前者創始人闫俊傑和周彧聰均來自商湯,又被譽為“商湯系”創業公司;後者則在今年2月完成B輪融資後成為目前國内大模型初創公司中估值最高的一家獨角獸。

以英偉達為代表的算力晶片仍是市場焦點,然而,受限于美國晶片管制政策,英偉達面向中國市場推出的特供版H20晶片,在成本效益和适用性方面未達市場預期,且采購需經過嚴格審查,在國内的出貨量受到一定影響,市面上在售的英偉達晶片大多為二手晶片。

某電商平台上,《IT時報》記者搜尋發現,不少服務商仍在售賣整機服務,某伺服器廠商售賣搭載8卡H100、A100的伺服器主機,标價在100萬~300萬元不等。記者咨詢客服後得知,目前價格仍有優惠可談,稍後記者拿到了更詳細的報價,相較首頁展示價格下調了20萬~60萬,并承諾可享受商家三年質保。

算力晶片和租賃價格“雙降”

某二手平台和社交軟體上,亦有銷售英偉達或華為昇騰的賣家不斷上線“吆喝”,配文稱“低價可談”、“報價有效期為一周,以最新報價為準”。

“上面商家所說的質保是商家質保,并非英偉達官方質保,是以價格好談。”上述業内人士說道。

“目前大廠仍在重押大模型,他們有資金、舍得投入。但據我了解,不少初創公司已經退出大模型賽道。很多算力營運商皆因高昂的硬體投入與維護成本面臨生存挑戰,無力采買大規模算力,也沒辦法幫客戶進行大規模部署。”彭璐認為,預計在2024年年底,國内算力賽道還将有一批中小玩家退場。

算力晶片和租賃價格“雙降”

算力價格企穩

當下,國内算力市場正由去年的賣方市場向買賣平衡轉變,産業鍊上下遊均在尋求适應新市場環境的發展模式,算力的售價也在企穩。

不久前,一家名為“超算網際網路”的平台打出8*A800 80GB伺服器,每卡每小時2元的促銷價,相較市場8~10元的價格,打了“骨折”。

算力晶片和租賃價格“雙降”

“這個價格還是噱頭為主,平台一共隻拿出了10萬元額度,最多也就9台8卡伺服器用一個月。”一位業内人士告訴《IT時報》記者,這個價格并不具有普遍意義。

但與去年底市場“蹦着”漲價相比,進入陽春三月之後,算力價格的确下降了。而且由于大型網際網路公司大多自建算力中心,而原先匆匆上線智算中心的IDC服務商也開始調整戰略,從單純提供裸金屬或整機雲伺服器租賃服務,轉向提供更多增值服務和PaSS服務。

“很多傳統企業并不知道AI能為自己做什麼?實際上,算力的真正需求還沒有被激發。”清醒異構創始人餘騰告訴《IT時報》記者,現在國内迫切需要的是,打通大模型落地的産業鍊,真正讓傳統企業主看到AI和算力的價值。

中國電子節能技術協會副理事長呂天文年初接受《IT時報》記者采訪時表示,“兩年後,國内算力市場會趨于穩定,淘汰和轉型是部分公司的結局。但這不失為一件好事,千模大戰和禁售政策鞭策了國産算力的進步,中小廠商也可盡快找準定位。”

算力晶片和租賃價格“雙降”

自動駕駛及醫療領銜垂直賽道

中國大模型公司正探索深耕細分領域以求突破。國家資料局局長劉烈宏在3月舉行的中國發展高層論壇2024年會上透露,中國10億參數規模以上的大模型數量已超100個,行業大模型深度賦能電子資訊、醫療、交通等領域,形成上百種應用模式,賦能千行百業。

“目前我們接到的自動駕駛需求較多,其次是醫療賽道,像科研機構、醫學影像之類的技術科室都很适合使用智算。”彭璐透露。

目前新能源汽車中,以華為為首,小米、理想、吉利等車企均在布局加碼大模型。醫療健康領域也表現出強勁發展力,此前,京東健康正式釋出面向醫療健康行業的大模型“京醫千詢”,百度釋出國内首個“産業級”醫療大模型“靈醫大模型”,醫聯正式釋出了自主研發的醫療大語言模型MedGPT等,均展現出超市場預期的發展前景。

算力晶片和租賃價格“雙降”

資料标注成重要瓶頸

從追趕OpenAI轉向精細化垂直應用,中國算力市場目前正進入關鍵階段。

“垂直賽道上,中國大模型有一定競争優勢,因為美國受限于當地電力消耗、法律監管等問題,部分地區的規模化部署可能面臨困境。”上述業内人士表示。

然而,随着國内大模型垂直賽道逐漸興起,資料标注成為制約行業發展的重要瓶頸。傳統人工智能中對于語音和圖像識别的資料标注,依賴絕對精準的簡單标注,并不要求标注人員掌握專業的領域知識,隻需具備普通人類通識能力即可。但垂直大模型的訓練效果,取決于精準的資料,并從人類回報中強化學習(RLHF)。也就是說,需要通過利用人類對結果的回報來指導智能系統“進化”。

算力晶片和租賃價格“雙降”

圖源:東方IC

提供回報的資料标注員需具備極強的專業素養,尤其是行業知識。特别是在專業性強、需要高度精準标注的領域,如建築設計、航空仿真模拟等,相關資料處理成本高昂且人才稀缺,領域發展受到一定影響。

算力晶片和租賃價格“雙降”

需加快形成全國一體化算力體系

2024年,生成式人工智能進入加速期。Open AI連續釋出多模态大模型“炸場”,美國對算力晶片的出口管制出台新政。算力裝置數量不足、自主研發能力不足以及高昂成本等問題,正制約着目前國内通用大模型的發展。

上述人士認為,相較GPT-4和即将面世的GPT-5,中國大模型仍有較大提升空間,中國企業仍在全球化競争中面臨嚴峻挑戰。

智算中心正成為支撐人工智能産業快速發展及經濟增長的新動能。《算力基礎設施高品質發展行動計劃》提出,到2025年,算力規模超過300EFlops,智能算力占比達到35%。

國家資訊中心釋出的《智能計算中心創新發展指南》預測,“十四五”期間,在智算中心實作80%應用水準的情況下,城市(地區)對智算中心的投資,可帶動人工智能核心産業增長約2.9至3.4倍。

時不我待,這場“國力競賽”期待更為強勁的引擎,同時也要謹防各地建設“一窩蜂”而導緻的資源浪費。據不完全統計,全國已有超過30個城市投建或準備投建智算中心,“算力賣給誰”是這些智算中心的必答題。

今年兩會期間,大陸《政府工作報告》首次提出,适度超前建設數字基礎設施,加快形成全國一體化算力體系,培育算力産業生态。

排版/ 季嘉穎

圖檔/ 超算網際網路 東方IC

來源/《IT時報》公衆号vittimes

E N D

算力晶片和租賃價格“雙降”

請加「星标」不錯過我們

算力晶片和租賃價格“雙降”
算力晶片和租賃價格“雙降”

繼續閱讀