天天看點

雲啟資本合夥人陳昱:AI大模型突破核心在工程優化,應用落地符合“二八定律”

作者:21世紀經濟報道

21世紀經濟報道記者駱轶琪 廣州報道

進入大模型發展時期,AI産業被視為進入了“iPhone時刻”甚至将來到“奇點”,諸多行業都将由此被改變。那麼對于産業和個人來說,機會将在哪裡?

近日舉行的2023小蠻腰科技大會暨AIGC人工智能峰會期間,雲啟資本合夥人陳昱接受21世紀經濟報道記者專訪時表示,目前還在競速中的國内AI大模型企業都有發展機會,核心在于不斷提升工程優化和技術疊代能力,同時也要充分挖掘創新應用場景。

在他看來,生成式AI落地到應用場景中,将是80%存量應用更新+20%新應用探索的“二八定律”局面。也将給正在演進中的技術,如元宇宙、自動駕駛等,帶來漸進式能力推動。

作為早期投資人,在面對AI大模型創業項目時,他看好有野心、懂技術、執行力強的團隊。畢竟如今競争對手衆多,如果執行力不夠,将很難在這一輪浪潮中跑出成果。據悉,2021年底,雲啟在天使輪投資的MiniMax,是國内第一家擁有自研多模态大模型的創業公司,目前已開放API接口,和WPS等衆多企業合作。

競速AI大模型

追根溯源,如今火爆全球的ChatGPT背後,是Transformer架構的支撐。這一技術早在2017年被谷歌提出,2018年谷歌還提出基于Transformer架構的BERT技術等。

“其實無論是早期的CNN(卷積神經網絡)還是Transformer,都屬于在深度學習領域,行業探索過程中尋求的不同網絡結構。恰好Open AI用解碼器decoder only架構,證明了Transformer的可行性,并把參數規模從十億擴充到上千億量級。”他續稱,是以這一方面有賴于深度學習算法的持續發展;另一方面英偉達提供的GPU算力支援同樣功不可沒。

實際上,在早期路徑探索中,谷歌認為decoder only路線可能會不如encoder+decoder(編碼-解碼)效果好,是以采用了另外一條路線,而谷歌内部長期有多個團隊在做不同嘗試。

最終Open AI持續疊代,加之RLHF(人類回報強化學習)後,證明了decoder only路線的可行性。随着路線被證明,谷歌很快也推出号稱可對标GPT4的大模型PaLM2。

“國内和國外有不同的大模型體系,投身AI大模型的國内企業,目前還是有一定機會。”陳昱對記者分析,目前GPT-4的水準可能已經達到了95分,國内很多産品在80分左右,但是并不存在代際差。

這時候更重要的是,一方面,AI大模型公司需要花費更多時間在工程優化和技術疊代上;另一方面,更需要産品經理的創新能力,充分挖掘AI大模型的創新功能。

“我覺得這一輪,微軟在創新應用方面做得比絕大部分公司好,近期微軟密集釋出新功能,比如在Bing中引入ChatGPT、适用于Windows 11的Windows Copilot等,是以也有聲音說,微軟的一系列動作要搶了創業公司的飯碗。”他續稱。

不過有行業觀點認為,Open AI更多是證明了Transformer架構路線的可行性,在具體落地時,或許未必要重投入,而是可以考慮小模型發展路線。

“目前業界存在不同觀點。”陳昱對記者分析,一部分人認為,小模型可能存在諸多優勢,如資源消耗較少、成本低,而成本低就是跑通商業模型的重要一環;同時,目前“大力出奇迹”的AI大模型中集合了太多資料量和能力,但實際在應用中或許未必需要。

但另一部分人認為,AI公司最終的發展目标都是瞄準通用人工智能(AGI),也即類似人類的大腦,在運轉過程中并不會分區,而是可以同時多路線思考運作,甚至各分區之間會互相作用,産生意想不到的效果。這條思路之下,就意味着需要大模型最終“一統江湖”。

總體來看,目前業界對這兩條路仍有分歧。“學術上也還沒有證明,大模型是否的确是參數量越多越好。畢竟目前AI的運作還是一個黑匣子。”

當然他也認為,并不是所有企業都需要有自己的大模型。“訓練大模型要從頭開始,這意味着巨大的資源消耗,需要衡量投入産出比。有時調用成熟的大模型,取得的效果可能遠比自己從頭搭建和訓練要好。”他強調,長遠來看,綜合考慮成本和收益是否算得過來賬很重要。

如何改變未來

目前最受關注的,便是在生成式AI浪潮之下,對應用生态和相關底層技術帶來的影響。陳昱對記者分析,在應用場景落地中,将是80%存量應用更新+20%新應用探索的局面。

具體來說,數字經濟、企業服務/SaaS服務等技術此前已經發展多年,通過引入更好的AI大模型能力,可以将既有技術進一步更新,把之前很難做好的體驗真正做到滿意;再如微軟近期不斷對旗下應用進行疊代更新,将極大提升内容生産力和工作效率。這都是由技術變革帶來的體驗變革。

當然也會誕生新的應用,比如這一輪生成式AI與前一輪預訓練模型不同的是,已經能夠處理多模态、多語言資訊,這将可能給教育、外貿等産業帶來新變化;此外,還将有面向開發者的AI解決方案(AI for Developers),可以幫助程式員編寫代碼、檢查安全漏洞等。

生成式AI技術的出現,也将給正在疊代中的技術路線帶來一定幫助,比如元宇宙和自動駕駛等。但這總體帶來的将是漸進式改變,而非颠覆式驅動。

陳昱對記者分析,AIGC對元宇宙的推動将主要在于素材生成。“元宇宙前期會在這方面花費較多時間,AIGC就可以幫助提高素材生成效率、節省創意時間。”

不過這并不能起到根本性推動作用。“元宇宙一直難以大面積落地,是因為暫時沒有剛需的應用場景。AR/VR被視為元宇宙的入口,但目前遇到的難題是,還沒有一款眼鏡達到可以長期佩戴使用的效果。”他指出。

對于自動駕駛的改善可以包括兩方面:感覺(perception)和規劃(planning)部分。

此前自動駕駛功能運作時,傳感器需要不斷收集外部資訊,進行标注。但有了AI大模型後,由于其具備zero-shot(零樣本)能力,可能就不再需要具象到所有可能出現的物體樣本進行标記。

而自動駕駛程序中,根據收集到的地圖、實時視覺等資訊後,該決策是加速、減速還是換道等,就可以運用到AI大模型的推理能力,這将會比現有自動駕駛所用模型做到更好的效果。

對雲計算的變化,陳昱指出,AI相關服務用量将激增,短期内會利好英偉達,但長久以後,雲廠商可能會發現,與其每年不斷向英偉達下訂單購買晶片,不如自己開發晶片或和其他晶片廠商合作。

“英偉達的強悍在于開發了一款相對通用的AI晶片,但如果雲廠商明确了未來幾年都會采用Transformer架構時,那麼自己也可以考慮針對Transformer優化一款專有晶片,是以也看到包括谷歌、微軟、Meta都有自己的晶片開發計劃。”他續稱。

AI大模型還在不斷滲透到軟硬體層面,如近期ChatGPT推出iOS版、百度為此推出硬體産品等。不過陳昱并不認為AI大模型的出現會對既有軟硬體生态帶來太大角色改變。

“我認為改變的可能是搜尋生态。”他續稱,比如ChatGPT就可能成為谷歌在搜尋方面的競争對手。這意味着對使用者使用習慣沒有太大改變,改變的隻是擷取資訊的途徑。

從社會影響來說,陳昱認為,這将對整個教育體系帶來巨變。可以類比此前計算機出現後,複雜的珠算、五位數乘法等學習,到今天多被電腦所取代,人們可以把腦力放在其他更有創造力知識的學習中去。“如果能夠利用好AI工具,幫助我們人類完成此前80%的工作,剩下20%可以更好地施展創造力和想象力,同時也會帶來新的職業暢想群組織範式。”

更多内容請下載下傳21财經APP

繼續閱讀