天天看點

大模型競速迎來“iPhone時刻” :高昂算力成本怎麼破?尋找優質“算料”或成博弈焦點

作者:這是憤世嫉俗的

每經記者:葉曉丹 每經編輯:董興生

6月1日,阿裡雲對外披露了通義大模型進展,推出聚焦音視訊的AI産品“通義聽悟”,該産品成為國内首個開放公測的大模型應用産品。

阿裡雲方面透露,通義聽悟接入了通義千問大模型的了解與摘要能力,能實作随時随地高效完成對音視訊内容的轉寫、檢索、摘要和整理,可成為使用者工作學習中的得力AI助手。

此前的5月6日,科大訊飛正式對外釋出“訊飛星火認知大模型”。據悉,6月9日,科大訊飛還将釋出這一大模型的新進展,包括開放式問答取得突破,多輪對話和數學能力再更新,文本生成、語言了解、邏輯推理能力持續提升等。

阿裡雲智能CTO周靖人在接受包括《每日經濟新聞》記者在内的媒體采訪時透露,通義聽悟結合了之前阿裡雲研發的語音能力,下一階段會陸續推出增強版并進行商業化安排。

大模型競速迎來“iPhone時刻” :高昂算力成本怎麼破?尋找優質“算料”或成博弈焦點

阿裡雲智能CTO周靖人(左) 圖檔來源:每經記者 葉曉丹 攝

今年4月26日,阿裡雲提出要走向“産品被內建”,形成“1+3+1”的産品被內建結構:頂層為MaaS模型即服務,阿裡雲向生态開放大模型能力和訓練底座。值得注意的是,阿裡雲此次釋出的通義千悟既可以作為SaaS應用層,又可以被內建為MaaS層。

可以說,阿裡雲将大模型提到了一個新的高度。阿裡巴巴集團董事局主席、首席執行官張勇表示,阿裡雲要全面走向“模型即服務”。一方面,阿裡雲希望大模型技術的應用打開更大的使用入口;另一方面,阿裡雲在4月底率先宣布公有雲大降價後,引發了公有雲市場多家雲服務廠商的價格調整。

技術疊代、價格下降,能否釋放新的增量空間、形成正向循環,有待新一季财報驗證。而對諸多雲計算廠商而言,大模型應用帶來了雲計算市場的“iPhone時刻”,新格局正在開啟。

公有雲“價格戰”連鎖反應

繼4月26日阿裡雲宣布公有雲價格大幅下調以來,騰訊雲、移動雲、京東雲等頭部雲廠商也先後降價。

5月16日,騰訊雲宣布對多款核心雲産品實施降價,部分産品線最高降幅達40%;5月23日,京東雲稱,全系核心産品的官網清單價均低于特定雲廠商官網對标的産品清單價格,實際成交單價将在特定雲廠商實際成交最低單價的基礎上再打九折,“買貴就賠”。

值得注意的是,公有雲價格戰對私有雲市場也有所攪動。5月初,一家IT服務商上市公司就告訴記者,公有雲市場的價格戰,也會進一步引起私有雲市場的價格向下。

大模型競速迎來“iPhone時刻” :高昂算力成本怎麼破?尋找優質“算料”或成博弈焦點

圖檔來源:每經記者 葉曉丹 攝

近日,一家頭部雲服務廠商的第三方服務商在和《每日經濟新聞》記者交流時亦透露,公有雲價格下降,必然給私有雲帶來一定的波動性。“但這和公司規模、行業有關,像大型央企國企、金融行業更看重安全保密性,選擇私有化比較多,而普通公司則會根據價格和需求來選擇。”

數瀾科技董事長甘雲峰在5月底的“數栖大會”上接受記者專訪時表示,公有雲市場的大降價對私有雲的建設成本有影響,不過,由于私有雲價格成本相對固定,是以私有雲的價格波動空間不會非常大。

而對于公有雲市場價格戰,甘雲峰表示,這對于下遊的資料應用服務商而言,可以有更好的促進作用。“過去客戶數字化的服務,在硬體上的投入往往占據大部分經費,而随着公有雲市場價格的下降,客戶可以将更多的費用投入到業務政策、應用層面,也更有助于行業的發展,尤其有助于資料應用領域的發展,可以讓終端客戶将更多的資金投入到業務場景,在産業資料上挖掘更多的價值。”

作為資料應用基礎設施供應商,數瀾科技搭建了一站式資料中台基礎設施“數栖平台”,提供資料中台解決方案、資料可視化服務、資料智能解決方案等産品矩陣。不過,甘雲峰也提及,客戶對雲計算廠商的選擇,一般不會根據價格高低進行調整,而是首先基于客戶選擇比對的伺服器。但基于成本考慮,會推薦更具成本效益的伺服器,讓客戶能夠有更多資金投入到真正的業務場景中。

而大模型技術為雲計算市場帶來了新的變化。招商證券研報分析認為,整體而言,大模型的定位從簡單的技術賦能轉向平台生态入口卡位,同時ChatGPT Plugins的出現将加速“AI+”時代生态的明晰和應用層的繁榮,兩者協同将為現代人類的生活帶來全次元的颠覆性變化。

周靖人透露,在各種企業與行業之間仍有不少基于大模型的新需求,阿裡雲還在繼續探索,接下來會釋出一系列新産品。對提出“模型即應用”的阿裡雲而言,在公有雲價格下降的同時,通過大模型打造新的生态入口,做大規模效應的成效如何,仍有待市場校驗。

走向開源是必然?

不過,從目前來看,大模型技術距離走向整個生态的繁榮還有一段路程。

而對以大模型為代表的AGI産業結構,此前的2023阿裡雲峰會上,招商局創投汪婧在演講中表示,整體結構共分為四層,分别是計算層、模型層、中間層和應用層。其中,如目前算力以及訓練成本會以多快的速度、下降多少,會影響到整個産業鍊。

大模型競速迎來“iPhone時刻” :高昂算力成本怎麼破?尋找優質“算料”或成博弈焦點

招商局創投汪婧 圖檔來源:每經記者 葉曉丹 攝

AI大模型催生了巨大的算力需求,目前,A100是大模型應用的“主力晶片”。據媒體報道,在眼下的AI時代,“算力即權力”似乎已成為行業主旋律,算力設施需求量仍在持續攀升。OpenAI指出,AI大模型要持續取得突破,所需消耗的計算資源每3~4個月就要翻一倍,資金也需要通過指數級增長獲得比對。

A100的價格大約為1萬美元,是目前AI應用的“主力晶片”。另據了解,此前一些零售商對另一款晶片H100的報價大約在3.6萬美元,近期價格又有了顯著上漲。

英偉達的研究表明,GPT3最大規模的模型需要使用175 Billions的參數量,需要使用512顆V100顯示卡訓練7個月時間,或者使用1024顆A100晶片訓練一個月時間。大模型訓練每月成本在數百萬美元以上量級。

大模型的開發成本高昂,也成為國内外巨頭一場昂貴的嘗試。

大模型競速迎來“iPhone時刻” :高昂算力成本怎麼破?尋找優質“算料”或成博弈焦點

圖檔來源:視覺中國-VCG41N1462568496

在業内人士看來,公共雲是AI新型基礎設施的最佳載體。頭部雲廠商已經搭建好超大規模、高性能、低成本的算力公共設施,不需要“重複造輪子”。

汪婧表示,在重資本和人才投入的基礎通用模型層,國内大廠會是通用大模型的重要參與者。與此同時,極少數創業公司以其人才技術積累,以及創新和靈活性,有機會在國内做出好用的通用大模型。

在應用層及中間件領域,汪婧表示,目前許多領域在國内尚未發展,随着後續國内基礎模型的能力提升和産業成本下行,預計未來會百花齊放。

每日互動董事長方毅在接受《每日經濟新聞》記者專訪時透露,大模型算法慢慢會走向開源,估計在未來三年内會迎來“安卓時代”,就是開源的大模型或達到相當水準的時代,會有更好的、更繁茂的生态發展。

周靖人在回應開源問題時表示:“我們其實非常支援開源,通過開源一系列的模型,能夠讓大家降低學習的成本,去嘗試自己的一些突破。每個企業有具體的核心業務環境,就需要更加精細化選擇,到底是用什麼樣的模型。”

5月30日,中國資訊通信研究院聯合産業各方共同編制“紙鸢”開放人工智能模型許可證,旨在為共同打造具有變革意義的大模型開源項目奠定堅實基礎。

中國信通院雲大所開源和軟體安全部主任郭雪表示,AI大模型的本質決定了開源是其必經之路。編制“紙鸢”開放人工智能模型許可證,正式為了充分發揮大型模型的通用性優勢,促進大型模型技術在産業中真正落地。下一步,将釋出《紙鸢開放人工智能模型許可證(征求意見稿)》。

尋找優質的“算料”

每日互動(300766.SZ,股價18.63元,市值74.54億元)董事長方毅認為,大模型計算需要大資料訓練,是以優質的資料非常重要。算法、算力很重要,而資料這個“算料”可能會更重要,“算料”将成為非常重要的一個引擎。

數瀾科技董事長甘雲峰則提出,大模型技術給大資料行業帶來了兩方面的主要影響。一是基礎能力建設,可以通過大模型技術完成,極大地提升效率。另一方面,目前存在資料急劇增長和算力增長之間的沖突,技術的進步已經跟不上資料的增速,大模型技術的應用對GPU要求非常高。

高昂的算力成本既然無解,當硬體發展跟不上軟體發展速度時,能否從資料入手,通過挖掘資料自身的組織能力來彌補算力短闆?甘雲峰認為,這是很有可能的,AI的土壤是資料。

大模型競速迎來“iPhone時刻” :高昂算力成本怎麼破?尋找優質“算料”或成博弈焦點

數瀾科技董事長甘雲峰 圖檔來源:受訪者供圖

在大模型“百花齊放”的背景下,民生證券在研報中指出,“單純釋出一個大模型的門檻沒有市場想象中的那麼高”,“有大模型不難,難的是有一個能持續疊代,性能不斷提升的優質大模型”。也有觀點提出,高品質資料才是大模型發展的稀缺要素。

資料要素也成為資本市場備受關注的細分領域。6月6日,資料要素概念股震蕩反彈,金橋資訊(603918.SH,股價34.08元,市值125.33億元)、中國科傳(601858.SH,股價48.14元,市值380.55億元)漲停;開普雲(688228.SH,股價61.84元,市值41.52億元)、中遠海科(002401.SZ,股價28.11元,市值104.54億元)、美亞柏科(300188.SZ,股價25.18元,市值216.42億元)等跟漲。

近期,多家券商的最新研報也對資料要素進行了密集覆寫。

德邦證券介紹,數字經濟的上遊基礎層在于資料價值化,上遊包括資料要素、信創、數字基建三個細分,其中資料要素又是整個數字經濟産業鍊循環的基礎。

天風證券分析認為,算法、算力、資料是AI核心三要素,目前AI大模型的訓練,算法端向神經網絡Transformer模型收斂,算力端依賴具備大規模并行計算能力的AI伺服器叢集,資料端則需要巨大資料量的大規模資料集投喂。AI三要素中資料是直接影響AI大模型在垂直行業落地效果的關鍵,而垂類資料通常由政府和行業機構掌握,相比于模型和算力,資料稀缺性明顯。

目前,通用大模型的訓練資料集多來自網際網路文本資料,例如ChatGPT訓練資料集來自維基百科、網際網路新聞、社交媒體、電子書等。彭博社釋出了針對金融領域的大型語言模型BloombergGPT,訓練采用51.27%金融資訊資料和48.73%的公共資料,在500億參數規模下,BloombergGPT對金融任務效果好于通用大模型。

那麼,未來針對“算料”的博弈是否會更加白熱化?

方毅認為,資料要素市場最終會形成某種程度上的開放合作。第一級的核心資料開發商可能以央企、國企為主,第二級開發商可能會有更多民營企業和市場化力量參與進來

每日經濟新聞