天天看點

“國家隊”下場,大模型“卷”向新緯度

作者:商業觀測

從群模亂舞,到國家隊引領

“國家隊”下場,大模型“卷”向新緯度

大模型的風在吹了半年後,終于有了新方向。

7月7日,在2023世界人工智能大會(WAIC 2023)上,由國家标準委指導的人工智能标準化總體組宣布,大陸首個大模型标準化專題組組長由上海人工智能實驗室與百度、華為、阿裡等企業聯合擔任。

對于首批入選的“國家隊”陣容,外界并不意外,畢竟大模型的發展,需要靠技術實力格外雄厚的玩家引領。而在國家明确他們的地位及任務後,國内大模型市場的風向,開始有了新變化。

01 狂飙半年,行業迎來“國家隊”

今年以來,大模型一路狂飙,速度超過了以往任何一項技術的發展程序。如果說在今年一季度,各個玩家蜂擁至大模型的入口,還在讨論“要不要做”的問題,到了二季度時,各家已經進化到具體“怎麼做”的問題上來。

而這樣的熱鬧場景,在WAIC 2023上迎來了高潮。這屆大會超400家企業參展、30多個大模型集中亮點,展區面積達到了5萬平方米,創下了曆屆之最。

這場熱鬧的大會,不少人因為沒有提前預約而無法進入大會現場。在被行業人士稱為“規格”很高的大會上,網紅馬斯克、圖靈獎三巨頭之一的楊立昆、華為輪值董事長胡厚昆、香港中文大學教授湯曉鴿,以及學界、創業界的大佬們紛紛到場。

展廳内,大模型時代、生成式AI、通用人工智能,這些在半年前還很陌生的詞彙,如今成為展廳裡随處可見的标志。

當然,大會現場的30餘家大模型的玩家們,也并沒有讓外界失望,紛紛給出了自己對于大模型的解答。尤其是“國家隊”成員的動作,更是令外界矚目。

比如百度,作為國内首家宣布All in人工智能的廠商,其在大會現場的展廳格外吸引人。當然,在這個重要的場合,百度自然會展出讓更多人能體驗到的“鎮館之寶”,這個被稱為文心一格的産品,可以讓進入展廳的觀衆實作P圖自由。

華為則将其“全球最快AI訓練叢集”Atlas 900 PoD A2搬到了現場。華為副董事長胡厚崑稱,使用 Atlas 900,人們隻需 59.8 秒就可以完成典型神經網絡 ResNet-50 在 ImageNet 資料集上的訓練,在同等精度下比第 2 名快 15%。“這相當于在短跑賽場上頭名撞線,然後喝完一瓶水才看到第二名跑到終點。”無疑,華為這場硬體端基礎算力的實力大秀,使得行業人士和觀衆将視線從大模型的繁雜移至硬體端的比拼。

在阿裡雲論壇,阿裡雲“通義家族”再添AI繪畫模型“通義萬相”,據稱,該模型可輔助人類進行圖文創作,未來可應用于藝術設計、電商、遊戲和文創等應用場景。阿裡雲智能集團CTO周靖人在現場表示,這是阿裡雲大模型全面掌握多模态能力的關鍵一步,未來這一能力還将逐漸向行業客戶開放。

“國家隊”下場,大模型“卷”向新緯度

“有錢、有人、有技術、有場景”,這是大廠做大模型先天具備的優勢,同時也是不少初創企業很難填平的鴻溝,甚至有人在現場直接指出,中國的大模型落地,隻會在五家大廠之中,即BAT+華為+騰訊。

但巨頭們要怎麼做?下一步會走向何方,這是一個很大的命題。

02 抛棄概念與情懷,巨頭紛紛專注于場景落地

今年的人工智能大會,大模型成為當之無愧的頂流。

阿裡通義、百度文心、華為盤古等國家隊紛紛亮出自己的硬實力,同時,訊飛星火、商湯日日新、網易伏羲等30多個垂類大模型也沒有輸掉氣勢,在各自的領域裡埋頭苦幹。

但從現場的情況來看,他們似乎已經摒棄了大而空、講故事、講情懷的做法,轉而開始專注于講落地場景和案例。這是大模型前進的必由之路,同時也極有可能成為下一階段的重頭戲。

在大會上,華為雲盤古大模型3.0正式釋出,引來不少行業人士圍觀。更令行業印象深刻的在于,華為常務董事、華為雲CEO張平安所言——盤古大模型很忙,忙着做事,沒有時間作詩。而作詩,正是此前半年釋出大模型的玩家們最愛幹的事。

在張平安看來,華為希望盤古大模型可以幫助各行各業,如金融、政務、礦山、氣象等,而非專注在語言大模型層面。據其透露,截至目前,盤古大模型已經在氣象、醫藥研發、電力等領域落地,并傳遞了多個千億參數大模型。

同樣把場景落到實處的還有百度。百度作為較早入局的玩家,早在四年前即釋出文心大模型,隻是當時行業對于大模型的關注度不夠,以至于沒有激起太多水花。但對于百度而言,文心大模型是先行業一步的超前布局。如今,這個前瞻的産品也收獲頗豐。

“國家隊”下場,大模型“卷”向新緯度

在WAIC 2023現場,百度首席技術官王海峰稱,現在百度已經更新到文心大模型3.5版本,較之此前的版本,效果提升50%、訓練速度提升2倍,推理速度提升了30倍。在成本上,更是降到過去的10%。

“把促進中國大模型生态的繁榮作為首要目标,向大模型創業公司提供全方面的服務”。阿裡雲CTO周靖人如此說道。很明顯,這延續了阿裡雲提出的MaaS(模型即服務)概念。

在大模型領域最晚入局的騰訊,最近20天内動作不斷。6月19日,騰訊首次公開透露對大模型的思考;6月26日,首次披露自研星脈高性能計算網絡;在7月7日WAIC 2023上,騰訊雲副總裁、騰訊雲智能負責人吳運聲對外公開了騰訊在大模型應用創新的成果,并稱,騰訊雲行業大模型能力已應用到金融風控、互動翻譯、數智人客服等場景中,提升了智能應用效率。

當然,細分領域的大模型也展現出旺盛的生命力。曠視科技聯合創始人、CTO唐文斌在接受媒體采訪時說道:“應用落地是衡量大模型價值的唯一标準,曠視科技會從視覺大模型向通用多模态大模型進軍。”

專注場景落地,切實為企業使用者提供降本增效的方案,成為當下大模型玩家集中發力的點。而未來,大模型早已從“做與不做”,真正邁進了“做得怎麼樣”的問題。而這正是大模型之争的下一步。

03 參與未來之争,先回答這四個問題

雖然大模型很火,但從開局到推向市場,中間還有很遠的一段路要走。在此過程中,很多難點已然暴露出來。

不過,在壹DU财經看來,大模型的未來之争,多半會在四個緯度展開。即:技術、人才、資金以及商業化落地。

首先看技術層面。毫無疑問,人工智能是目前最為先進的技術之一,在技術層面,其所需要的積澱不可能在短時間内補齊。“大”算力、“大”資料、“大”模型是目前大模型的基本特征,同時也是大模型的産業化落地面臨的挑戰,目前來看,資料規模雖大,但資料品質參差不齊。其次,模型的體積大,訓練難度更高,第三是算力規模大,對硬體性能要求會更高。

這也意味着,沒有足夠的資金作為支撐,很難組建這樣一個超強的戰隊。一位營銷雲創始人與壹DU财經溝通時曾提到:“從3月份投入做行業大模型以來,整體資金投入非常大,甚至超過了公司成立到做大模型之前的總和。”不過,他也提到,如果做成了,對于公司的未來十年發展,絕對是定心丸。

在此之前,不少行業人士就曾提出“大模型是大廠燒錢的遊戲”。這種說法并非毫無道理。

雖然大模型很火,但全球範圍來看,資本卻未跟上技術複蘇的節奏。研究公司PitchBook的資料稱,今年前六個月,全球風險投資資金幾乎減少了一半,下降48%至1739億美元,交易數量也下降了19%。

在中國,截至今年6月底,有十幾家大模型初創公司獲得融資,在已經公布融資額的企業中,融資規模最大的是MiniMax,今年6月獲得騰訊公司超過2.5億美元A輪融資;光年之外在被美團收購前,也獲得了2.3億美元的天使+輪融資。

再來看大廠的投入情況,此前,钛媒體的統計資料頗能說明問題,2022年,華為在研發費用上投入為1615億元,成為國内研發投入最多的企業;其次是騰訊,雖然低了不少,但也保持在614億元的水準,阿裡排在第三,研發費用為555億元。公開資料顯示,百度作為較早入局人工智能的玩家,過去十年,其在AI領域的投入超過1000億元。這樣的投入規範,顯然不是一般企業可以比拟的。

“國家隊”下場,大模型“卷”向新緯度

有技術、有資金,大廠們對于人才的吸引力相對更強。今年年初,各家開始了瘋狂的人才搶奪戰。百度以25-40K的月薪招聘AI大模型算法工程師,更闊氣的阿裡以40-70K的月薪招募大模型訓練及算法工程師。

在某招聘平台上搜尋關鍵詞“大模型”後,會發現,一些企業願意給到2023屆畢業生15-25K月薪的待遇。同時,一些垂直賽道的企業也參與了這輪搶人大戰。比如某貿易公司招聘的醫療大模型産品經理,薪資範圍為25-50K,某遊戲公司招聘語言大模型的算法工程師,也給到了最高50K的薪資。甚至中國電信招聘的大模型平台産品經理年薪可以達到84萬的水準。

水漲船高的人才、技術以及資金,無不催促着大模型的玩家們盡快落地、盡快商業化,畢竟,按照商業規律,最終這些投入需要産出回報,才有價值。

但大模型的落地成本,同樣是各大玩家需要跨過的檻。曾有行業人士估算,大模型訓練一次的成本極高,達到了200-12000萬美元。這也意味着,AI大模型的商業化落地,可能還得回到成本核算這件事上。

結語

站在當下看大模型,整體很像1998年的網際網路,初于起步階段,泡沫很大,機會也很大。在這種情況下,真正有實力的好公司,未來的成長性會更好,價值也會越來越大。