天天看點

華為盤古大模型7月将重磅更新,國内大模型軍備競賽走向何方

作者:南方都市報

AI大模型掀起的浪潮,一浪高過一浪。不久前,英偉達總市值首次突破萬億美元,成為僅次于蘋果、微軟、谷歌、亞馬遜的美股市值第五大公司。這是一個标志性的事件,随着大模型、生成式AI的快速發展,來自全球市場對AI算力的旺盛需求,将英偉達送上了浪潮之巅。

“英偉達一天暴漲2000億美元的市值,等于一個AMB、兩個英特爾,很大程度上正是源于AI訓練對算力的需求。”6月17日,在華為開發者聯創日深圳首站的活動現場,北京前沿金融監管科技研究院執行理事長、貝克資本董事長兼CEO張克感歎道。

行業專家指出,大模型的參數規模正越來越大,ChatGPT-3擁有1750億個參數,GPT4沒有公開,但預計超過萬億的量級,已經和人類神經元連接配接數差不多,這也讓大模型的推理決策能力達到了令科學家恐慌的地步。

華為盤古大模型7月将重磅更新,國内大模型軍備競賽走向何方

華為開發者聯創日深圳首站

在當天活動現場,與會嘉賓圍繞AI技術的趨勢前瞻、行業應用、開發者成長等展開交流探讨。華為開發者關系部部長許勁松表示,數字經濟已經成為推動經濟增長的主引擎之一,人工智能正在推動産業進入數字時代,AI正在從感覺了解世界到創造生成式世界,生成式AI很火,并推動整個産業智能化的更新。

大模型正在引領新一輪人機革命

回顧人工智能發展的曆史,1960年代至1990年代,第一代人工智能是以知識驅動的人工智能,主要代表是專家系統;1990年至2020年,第二代人工智能是以資料驅動的深度學習為代表的連接配接主義,其特點是資料+算力+算法;2020年至今,第三代人工智能以“知識+資料”為驅動,特點是常識、經驗、推理等類人思考的能力。

自2022年12月ChatGPT問世以來,AI大模型正是加速了新一代人工智能的發展。當大模型和生成式AI的技術不斷取得突破,衆多行業人士紛紛開始思考大模型技術在商業化營運中,将會産生何種效用。

會上,華為AI技術規劃專家王琛表示,大模型正在引領新一輪人機革命,為使用者帶來颠覆式使用體驗。他介紹,在PC時代,“滑鼠+圖形使用者界面”開啟了第一次互動革命;“觸屏+手勢”開啟了移動互聯時代;而“對話+5G”則開啟了智能互聯時代,标志就是以ChatGPT為代表的大模型技術。

王琛表示,大模型技術還正被用于企業服務,通過公有雲、私有雲、Finetune(專有訓練+推理資源)等部署模式,助力企業應用更新。随着AI能力的不斷強大,未來,華為與衆多行業夥伴需要考慮的,将是如何有責任地使用AI,讓其真正成為人類社會進步的推動力。

王琛認為,目前人工智能的深度學習還面臨三大難題:一是泛化性差,二是難以與領域知識融合,三是安全可信。美國自然科學基金會指出,AI系統進入千行百業,關鍵是融合更多的關鍵知識領域,比如說AI和農業、實體、化學的技術相結合;在今年的AI大會上,則釋出了堅守有責任的使用AI的章程,提出了大模型時代堅持的原則,如人類可審計、開源可擷取等标準。

王琛表示,目前正處于第二代人工智能向第三代人工智能交替的階段,“知識+資料”驅動使得AI的系統是具有常識經驗推理等人類思考的能力。

他認為,未來AI技術突破有三個方向:一是以大模型為基礎,“語言”牽引“AI編解碼”模型架構趨于統一,未來模型向“模态時空動态”演進;二是通用求解器,從遊戲到AI4Science,結合專家知識突破挑戰NP-hard難題,未來“預測與控制”深入應用;三是EmobodiedAI,內建AI,AI與實體世界的互動,積累更多經驗和常識,提升推理能力,達到與人類共生。

王琛也提醒說,未來要有責任地使用AI,過去人們讨論AI能做什麼,現在談論AI不能做什麼,未來要讨論不能讓AI做什麼。

AIGC大爆發,2025年将有10%的資料由AI創造

人工智能邁入新階段,AIGC持續火爆。Al生成内容 (Al Generated Content, AlGC),生成式Al是指計算機通過機器學習從現有資料中學習一個對象(物品、産品或任務)的要素,進而生成一個全新的、原創的、真實的、與原來内容相似的對象。

華為雲AI生态技術專家夏飛認為,AIGC的火爆預示着人工智能發展的趨勢,從感覺世界到了解世界,如今已經開始創造世界。

Gartner在2021年釋出的《人工智能對人類和社會的影響》,預計至2023年将有20%的内容被生成式Al所建立,至2025年,生成式AI産生的資料将占所有資料的10%,而今天這個比例還不到1%。目前的生成式AI仍處于萌芽期,預計将在2-5年内實作規模化應用。

夏飛援引的資料顯示,預計2030年,中國AIGC市場(僅包含内容創作,不含Al代碼生成)将達到萬億的規模。與Al市場空間比例類似,全球市場約5~7萬億。最近1-2年的市場空間主要集中在AI直接生成的内容作為業務變現點。未來3~5年,更大的市場空間會延伸至營銷推廣、資料合成(作為補全資料的方式)、虛拟陪伴、遊戲政策生成、遊戲角色生成等方面。

夏飛也指出,目前很多的公司進入AIGC這個賽道,但是AIGC不光需要技術突破,還是一項系統性的工程,從底層的算力資源需求,到上面的內建架構層以及AI平台層都需要有一定的積累,不能盲目跟風冒進。比如模型訓練的成本很高,估算一個大模型一次訓練成本在幾百萬美元到幾千萬美元不等,訓練的過程中稍有差池就打水漂了。

大模型軍備競賽是巨頭間的戰争,國内相繼誕生了百度文心一言、阿裡雲通義千問、騰訊混元大模型、華為盤古大模型等。業内人士認為,國内能夠把兩萬塊GPU卡訓練出來的公司,隻有5家企業以内,能夠把通用大模型做出來的隻有3到4家。

而華為是這場競賽中重要的種子選手。此前,南都灣财社記者曾向一名華為内部的接近人士處了解到,華為盤古Chat會在今年7月釋出。在當天的活動現場,夏飛也提到盤古大模型在7月會有重磅的更新。

夏飛介紹,華為盤古大模型釋出了CV大模型、NLP大模型、科學計算大模型等,華為在大模型的領域研究多年,擁有多模态中文資料庫,判别模型與生成模型結合,能夠靈活支援下遊任務,如文生圖、文本導向的圖像補全、圖檔編輯等。

活動現場,夏飛還展示了在華為盤古大模型的支援下,AIGC完成了文本生成、圖檔生成、視訊剪輯等内部應用,以及AIGC跟手機廠商合作,自動生成手機的屏保,跟品牌零售商合作,生成不同商品的海報和廣告圖檔。

采寫:南都灣财社記者 程洋

繼續閱讀