天天看點

今年,中國AI大模型産業發展看這些

今年,中國AI大模型産業發展看這些

機器之心報道

作者:澤南

現在的人工智能,已不是「可以用」,而是「非常好用」了。

上個星期,谷歌與李世石一次久違的對話,喚起了人們的回憶:

今年,中國AI大模型産業發展看這些

仔細想來,自 2016 年 AlphaGo 在圍棋上打敗人類起已過去八年。如今人工智能技術的發展卻絲毫沒有減速,正在給我們創造更大的震撼。

生成式 AI 技術從引領技術爆發的 GPT-4 開始,已經席卷了各個領域。不論是自動寫文章,還是生成圖檔和視訊,大模型等技術正随着 Copilot、AI 手機等産品逐漸落地。在可見的未來,向我們招手的還有具身智能 —— 通過軟硬體結合,機器人正在變得更聰明,即将代替我們的部分勞動。

今年,中國AI大模型産業發展看這些

最近,「新質生産力」理論正成為科技領域的熱門話題。新質生産力是以新産業為主導的生産力,它相對傳統生産力呈現出颠覆性創新驅動,具有産業鍊條新、發展品質高等特征,對新舊動能轉換發揮着引領性作用。

而 AI 大模型技術的突破,正是驅動科技創新,建構未來産業的強大動力。人工智能帶來的科技革命可能會像工業革命、資訊革命一樣,給每個人的生活帶來巨大的改變。

3 月 26 日,博鳌亞洲論壇上,人民網正式釋出了《2024 年中國 AI 大模型産業發展報告》,闡述了中國 AI 大模型的發展現狀和典型案例,深入探讨國内 AI 大模型産業發展所面臨的挑戰,同時也對未來趨勢進行了展望。

今年,中國AI大模型産業發展看這些

報告下載下傳連結:http://download.people.com.cn/jiankang/nineteen17114578641.pdf

其中有關「下半場」競争态勢、端側應用爆發等判斷,尤為值得關注。

AI 大模型技術落地,将是大浪淘沙

人工智能在持續發展的過程中,已在很多地方實作了落地,包括但不限于語音識别、人臉識别、機器翻譯、目标檢測、圖像生成、輔助駕駛等等方面。很大程度上,新技術已經在幫助千行百業提高生産力了。

随着生成式 AI 技術的發展,智能化更新的範圍還将擴大,程度還會更高。作為擁有 AI 完整産業體系的國家,新一代 AI 方案正在中國深入各行各業。

不過,要實作真正的技術變革,我們還面臨着一系列挑戰。

第一個挑戰是算力短缺。随着大模型規模呈現指數級增長,算法越來越依賴高性能 AI 晶片。有市場研究公司報告稱,去年僅 Meta 和微軟兩家公司就從英偉達處分别購買了 15 萬塊 H100 GPU,各花去約 45 億美元,但這還遠遠不夠:基于 H100 的伺服器的傳遞周期已經長達 52 周。

在國内,高性能 AI 晶片市場還因為進出口限制和技術瓶頸的雙重影響,大模型産業發展正在受到算力層面的制約。

第二個挑戰是大模型架構的局限性。如今的 AI 預訓練大模型均采用自注意力機制的 Transformer 神經網絡結構,它在自然語言處理等領域具有諸多優勢,包括可實作完全并行計算、捕捉長距離依賴關系、子產品化設計、處理不定長序列、結構擴充以及預訓練效果好等等。

但随着人們的不斷開發與擴充,transformer 固有的算力消耗資源大、記憶體占用多、泛化能力有局限性等問題也逐漸顯現。

就連 Transformer 論文《Attention Is All You Need》的七位原作者在最近 GTC 大會的圓桌讨論上也表示,這個世界需要比 Transformer 更好的東西,才能将我們帶到新的性能高原。

對資料的運用,是制約大模型落地的另一個重要因素。對于從頭開始訓練的大模型,語料資料的品質很大程度上會影響模型能力。大模型對資料供給的要求極高,比如 OpenAI 在訓練 GPT-4 時,就在大約 13T token 的資料上進行了訓練,其中包括基于文本和基于代碼的資料,以及來自 ScaleAI 和内部的一些微調資料。

相對而言,國内的 AI 大模型資料面臨着資料類型不全面、資訊可信度不高等問題。整體來看,可用于大模型訓練的中文資料庫相比英文資料,體量嚴重不足。

最後,我們還在期待更多爆款應用。ChatGPT 自釋出以來迅速成為史上增速最快消費級應用,提供支援的微軟也将大模型技術引入到了 Office、Teams 甚至 Windows 作業系統中。而在國内科技公司的生态中,至今仍沒有出現類似的爆款級應用,原因可能在于尚未找到商業化思路,技術、個性化程度仍未滿足使用者需求。

可以說,在生成式 AI「百模大戰」後,算法創新優化、生态建構和應用落地等任務,為正在建構 AI 技術體系的公司提出了更高的要求。隻有少數脫穎而出者,才會進入未來的大規模應用階段。

新方向已出現:走向端側,端雲結合

毫無疑問,在 AI 新技術上,國内科技公司一直在堅持投入,已經收獲了不小的成果。

通過大規模資料訓練,數百億甚至千億參數量級的通用大模型能夠學習捕捉複雜規律和特征,對前所未見的資料做出預測。通用大模型能了解學習多種任務,得益于大規模預訓練和微調範式,可完成多領域任務,并具備多模态的了解和生成能力。

以百度文心一言、阿裡通義千問、科大訊飛星火、騰訊混元大模型等為代表,一批高參數體量的雲端大語言模型充分利用了算力和海量訓練資料,已經能提供語言了解、知識問答、數學推理、代碼生成等能力。

它們一邊面向 C 端個人使用者提供智能問答、文本摘要與生成、圖檔生成、視訊生成等功能。另一方面面向 B 端企業使用者,正在改變企業的傳統業務模式,正在提供智能化營銷、客服、自動會議記錄、文本翻譯、預算管理等前所未有的能力。

基于通用大模型基礎,我們看到了面向特定行業和領域的專用大模型,已開始進入金融、政務、醫療等領域。

而在端側方向上,接連出現了 AI 手機和 AI PC 兩個新概念,大模型展現了廣泛的應用前景。

基于端側深度優化的「小體量」預訓練模型能力,個人裝置的使用方式和習慣正在被重塑。AI 已經能提供文檔搜尋、智能識屏、圖像創作、生活助手、出行助手等個性化服務。随着大模型的極緻優化,人們甚至在展望智能穿戴裝置上的大模型應用。

今年,中國AI大模型産業發展看這些

端側大模型一方面可以為人們帶來更加個性化的 AI 能力,對使用者意圖進行更深度、精準、細膩的了解,提供更加個性化的複雜場景服務。同時也能夠保證資料位于端側,保護了人們的隐私資訊。

另一方面,一部分雲端計算任務轉移給終端處理,還會大幅降低算力成本;一些複雜的工作和在端側處理後的内容,也可以通過網絡交由雲端千億級,甚至萬億級的 AI 大模型來進行處理,這就是「端雲協同的 AI」。

端雲協同進化的大模型體系有望解決目前大模型範式面臨的一些問題與挑戰:

在計算資源方面,端雲協同能夠充分利用雲端、終端的碎片化計算資源,并與通信以及存儲資源進行聯合優化;

在模型架構方面,端雲大小體量不同的模型以及聚合的新模式,同時獲得了大模型的湧現能力與小模型的功耗優勢;

在資料方面,快速發展的大、小模型和各類應用正在催生規範化、行業細分的資料治理體系;

在應用方面,端側大模型在了解使用者意圖後,可以高效調用其他大模型、服務和硬體能力,實作極高的可用性。

這或許會是新一輪人工智能的變革方向所在。

AI 手機落地引領趨勢

正是因為端側 AI 大模型和「端雲協同」的前景,率先把大模型落地到消費級領域的,是各大手機廠商。

去年末到今年初,國内衆多廠商陸續推出了新一代旗艦手機,生成式 AI 能力不約而同地成為了釋出的重點。

這些手機廠商提出的「AI 手機」有的發力意圖了解,通過端側 AI 技術,以人為中心,利用個性化資訊、傳感器能力大幅提升手機的情境感覺水準,帶來各種高效的智慧服務。

有的通過平台化 AI,以端側 + 雲側模型連接配接各類服務,實作了高效的推理決策。而利用大模型「智能體」将複雜任務分解,并在每個子步驟實作自主決策,手機不僅對人發出的指令和需求實作了深度了解,還可以進一步簡化操作,自主實作多種複雜目标。

在這其中,vivo 在大模型端側化、矩陣化的表現尤為突出,在新釋出的報告中作為企業案例獲得了詳細介紹。

去年 11 月,vivo 正式釋出了自研 AI 大模型「藍心 BlueLM」,并搭載于新一代旗艦手機 vivo X100 系列上率先落地。

這是行業内首個在手機端運作的開源自研大模型,其覆寫十億、百億、千億三個參數量級,共計五款模型。基于藍心大模型能力,vivo 在端側提供了藍心小 V 和藍心千詢兩款應用,并為手機提供了全局智能輔助功能。

vivo 的技術創新,已經讓很多人享受到大模型帶來的便利。官方給到我們一組數字:藍心大模型目前已經覆寫了超過 2000 萬使用者,實作了 2761 萬次高品質問答、生成了 1757 萬張畫,寫了 649 萬份報告,「AI 修圖」功能還消除了 85 萬個路人。

在這背後既有端側大模型能力和優化帶來的優勢,還有 vivo 大模型矩陣化的功勞:不同參數量級的大模型可以通過多種部署方式應用于不同場景,在滿足使用者手機端側體驗的同時,優化了推理性能以及端側部署時占用的記憶體和功耗。

其中,藍心大模型的 1B 和 7B 版本可在手機端運作,既實作了面向端側硬體能力的優化,又提供了良好的 AI 生成能力,使得一些應用可以全天候正常運作。

70B 版本的藍心大模型則是面向雲端服務的主力模型,提供角色扮演、知識問答等能力,既有智能湧現,也能兼顧成本和性能。面向複雜任務,vivo 也通過 1300 億和 1750 億兩款大模型,依靠更豐富的知識量,帶來了更加專業的智能體驗。

今年,中國AI大模型産業發展看這些

随着參數量的提升,藍心大模型逐漸具備了文本總結、語言了解、文本創作、知識問答、角色扮演、複雜邏輯推理、複雜任務編排等能力。結合新一代手機的 AI 算力,藍心大模型實作了端側部署與端雲結合的能力。

博鳌亞洲論壇期間,vivo 介紹了藍心大模型的最新落地進展:目前手機使用者們獲得的 AI 能力已更新到「端側 7B」+「雲側 70B」的組合,充分利用到了端雲結合的優勢。

今年,中國AI大模型産業發展看這些

vivo 在人工智能技術的四大次元 —— 資料、人力、算法、算力上都做到了領先:自 2017 年起,vivo 組建了人工智能研究團隊,并建設知識圖譜積累資料,多年來已在頂級期刊發表了一系列高水準論文。vivo 的研究成果正在不斷轉化為工程應用,目前其自研大模型已位居大語言模型綜合性考試評測集 C-Eval 中文榜單前列。

今年,中國AI大模型産業發展看這些

C-Eval 排行榜:https://cevalbenchmark.com/static/leaderboard_zh.html

通過對手機生态和使用者使用特征的深度思考,端側智能助理通過大模型的加持獲得了前所未有的能力,已不僅僅是「能夠與人自然對話」,而是在大量使用者學習、生活、工作等場景上都帶來了颠覆性的體驗。

2024 年,AI 大模型應用落地爆發?

AI 手機還有很大的發展空間。随着 AI 算法疊代優化、晶片性能提升和應用場景拓展,新生産力将日益普及,滿足人們不斷增長的多元化需求。

AI 大模型将深刻影響人們與裝置互動的方式,今年或許就将發生質變。

在博鳌論壇上人們表示,2024 年随着從政府到開發者各個層面的支援、使用者需求的激增,再加上科技公司投入力度的推動,大模型将進入快速發展的階段。如果具體到手機上,結合 AI 大模型端側化、矩陣化的技術演進,大模型技術的落地将颠覆一系列我們眼中一成不變的功能。

我們可以期待未來手中的裝置,能夠呈現出完全不同的形态。

繼續閱讀