天天看點

國内大模型競賽火力全開 華為盤古大模型7月更新

作者:南方都市報
國内大模型競賽火力全開 華為盤古大模型7月更新

AI大模型掀起的浪潮,一浪高過一浪。不久前,英偉達總市值首次突破萬億美元,成為僅次于蘋果、微軟、谷歌、亞馬遜的美股市值第五大公司。“英偉達一天暴漲2000億美元的市值,等于一個AMB、兩個英特爾,很大程度上正是源于AI訓練對算力的需求。”6月17日,在華為開發者聯創日深圳首站的活動現場,北京前沿金融監管科技研究院執行理事長、貝克資本董事長兼CEO張克感歎道。

行業專家指出,大模型的參數規模正越來越大,ChatGPT-3擁有1750億個參數,GPT4沒有公開,但預計超過萬億的量級,已經和人類神經元連接配接數差不多。

活動現場,與會嘉賓圍繞AI技術的趨勢前瞻、行業應用、開發者成長等展開交流探讨。

大模型引領新一輪人機革命

回顧人工智能發展的曆史,1960年代至1990年代,第一代人工智能是以知識驅動的人工智能,主要代表是專家系統;1990年至2020年,第二代人工智能是以資料驅動的深度學習為代表的連接配接主義,其特點是資料+算力+算法;2020年至今,第三代人工智能以“知識+資料”為驅動,特點是常識、經驗、推理等類人思考的能力。

會上,華為AI技術規劃專家王琛介紹大模型技術正被用于企業服務,通過公有雲、私有雲、Finetune(專有訓練+推理資源)等部署模式,助力企業應用更新。王琛認為,目前人工智能的深度學習還面臨三大難題:一是泛化性差,二是難以與領域知識融合,三是安全可信。美國自然科學基金會指出,AI系統進入千行百業,關鍵是融合更多的關鍵知識領域,比如說AI和農業、實體、化學的技術相結合;在今年的AI大會上,則釋出了堅守有責任的使用AI的章程,提出了大模型時代堅持的原則,如人類可審計、開源可擷取等标準。

王琛表示,目前正處于第二代人工智能向第三代人工智能交替的階段,“知識+資料”驅動使得AI的系統具有常識經驗推理等人類思考的能力。

他認為,未來AI技術突破有三個方向:一是以大模型為基礎,“語言”牽引“AI編解碼”模型架構趨于統一,未來模型向“模态時空動态”演進;二是通用求解器,從遊戲到AI4Science,結合專家知識突破挑戰NP-hard難題,未來“預測與控制”深入應用;三是EmobodiedAI,內建AI,AI與實體世界的互動,積累更多經驗和常識,提升推理能力,達到與人類共生。王琛也提醒說,未來要有責任地使用AI。

AIGC大爆發

2025年将有10%資料由AI創造

人工智能邁入新階段,AIGC持續火爆。Al生成内容(Al Generated Content,AlGC),生成式Al是指計算機通過機器學習從現有資料中學習一個對象(物品、産品或任務)的要素,進而生成一個全新的、原創的、真實的、與原來内容相似的對象。

華為雲AI生态技術專家夏飛認為,AIGC的火爆預示着人工智能發展的趨勢,從感覺世界到了解世界,如今已經開始創造世界。

Gartner在2021年釋出的《人工智能對人類和社會的影響》,預計至2023年将有20%的内容被生成式Al所建立,至2025年,生成式AI産生的資料将占所有資料的10%,而今天這個比例還不到1%。

夏飛援引的資料顯示,預計2030年,中國AIGC市場(僅包含内容創作,不含Al代碼生成)将達到萬億的規模。與Al市場空間比例類似,全球市場約5~7萬億。最近1-2年的市場空間主要集中在AI直接生成的内容作為業務變現點。未來3~5年,更大的市場空間會延伸至營銷推廣、資料合成(作為補全資料的方式)、虛拟陪伴、遊戲政策生成、遊戲角色生成等方面。

夏飛也指出,目前很多的公司進入AIGC這個賽道,但是AIGC不光需要技術突破,還是一項系統性的工程,從底層的算力資源需求,到上面的內建架構層以及AI平台層都需要有一定的積累,不能盲目跟風冒進。

大模型競賽是巨頭間的戰争,國内相繼誕生了百度文心一言、阿裡雲通義千問、騰訊混元大模型、華為盤古大模型等。業内人士認為,國内能夠把兩萬塊GPU卡訓練出來的公司,隻有5家企業以内,能夠把通用大模型做出來的隻有3到4家。

而華為是這場競賽中重要的種子選手。在當天活動現場,夏飛也提到盤古大模型在7月會有重磅的更新。

夏飛介紹,華為盤古大模型釋出了CV大模型、NLP大模型、科學計算大模型等,華為在大模型的領域研究多年,擁有多模态中文資料庫,判别模型與生成模型結合,能夠靈活支援下遊任務,如文生圖、文本導向的圖像補全、圖檔編輯等。

活動現場,夏飛還展示了在華為盤古大模型的支援下,AIGC完成了文本生成、圖檔生成、視訊剪輯等内部應用,以及AIGC跟手機廠商合作,自動生成手機的屏保,跟品牌零售商合作,生成不同商品的海報和廣告圖檔。

騰訊雲布局行業大模型

湯道生:加速大模型在産業場景的創新探索

ChatGPT引發了全球“大模型”熱潮,人工智能産業進入新的發展階段。如何掌握“下一個十年”的核心競争力,在新拐點中建構優勢成為企業關注的新命題。6月19日,騰訊雲在國家科技傳播中心召開行業大模型及智能應用技術峰會,首次公布騰訊雲行業大模型研發進展,依托騰訊雲TI平台打造行業大模型精選商店,探索大模型應用實踐的可行路徑。

生态共建是AI發展

有效路徑

會上,騰訊雲聯合22家客戶正式啟動行業大模型共建合作,并攜手17家生态夥伴共同發起了“騰訊雲行業大模型生态計劃”,緻力于共同推進大模型在産業領域的創新和落地。基于騰訊HCC高性能計算叢集和大模型能力,騰訊雲已經為傳媒、文旅、政務、金融等10餘個行業提供了超過50個大模型行業解決方案。

騰訊集團進階執行副總裁、雲與智慧産業事業群CEO湯道生表示,生态共建是AI發展的有效路徑,騰訊将堅持生态開放,為企業提供高品質模型服務,同時支援客戶多模型訓練任務,加速大模型在産業場景的創新探索。

目前,通用大語言模型在應對産業場景落地時存在一定的局限性。首先,通用大模型的訓練資料主要來自公開資料集或網絡資料,對于特定行業的專業領域知識了解有限。此外,通用大語言模型的訓練需要大量計算資源和漫長的訓練周期,這對企業來說可能昂貴且耗時。同時,安全和合規也是必要考量因素。

根據自身業務場景需求

定制不同規格模型服務

對于企業而言,選擇定制一個專屬大模型,或許是解決這些問題的最佳答案。騰訊雲針對上述行業應用的痛點和需求,依托騰訊雲TI平台打造行業大模型精選商店,提供涵蓋模型預訓練、模型精調、智能應用開發等一站式行業大模型解決方案。在TI平台内置行業大模型基礎上,企業加入自己獨有的場景資料,就可以快速生成自己的專屬模型;同時,也可根據自身業務場景需求,“量體裁衣、按需定制”不同參數、不同規格的模型服務。

在加速産業場景探索的同時,騰訊雲行業大模型能力已在騰訊企點、騰訊會議、騰訊雲AI代碼助手等多款頭部SaaS産品中率先應用。

湯道生表示:“今天,我們再一次站在數字科技革命的起點上,大模型隻是開端,AI與産業的融合,将綻放出創造力的未來。”

采寫:南都·灣财社記者 程洋 受訪者供圖

繼續閱讀