天天看點

再不做AI應用,大模型靠什麼赢?

作者:钛媒體APP

成熟的“格子衫”和年輕的“臉龐”,與開發者有關的大會總是少不了這兩種元素,Create 2024百度AI開發者大會也不例外。

過去幾十年,層出不窮的程式設計語言、架構等新技術,把一代又一代年輕的臉龐,塑造為成熟的格子衫,軟體應用開發的效率确實在提升,但卻總是跟不上龐大而又繁雜的需求,似乎開發者将永遠陷入在這樣的循環。

直到大模型的出現。

“你隻要會說話,就可以成為一名開發者,用自己的創造力改變世界。”百度創始人、董事長兼首席執行官李彥宏言之鑿鑿。

再不做AI應用,大模型靠什麼赢?

擲地有聲。成熟的格子衫還在思考,話語有幾分可信與其間難題,年輕的臉龐已經深信不疑,迫切想要聽到該如何“說話”,才能成為新時代的開發者。

基礎大模型的确炫人眼目,大部分人如今還沉浸在基礎模型層面,但是時候把更多目光聚焦在應用層面,先是大模型等新技術為應用場景提供了新的可能性,接下來就是軟體應用生态的繁榮,去推大模型的再次提升。

而百度正在做的事,就是掃平大模型和應用之間的障礙,這也是本次開發者大會,百度拿出的三大工具——智能體開發工具AgentBuilder、AI原生應用開發工具AppBuilder、各種尺寸的模型定制工具ModelBuilder。

大模型,應用為王

“大語言模型本身并不直接創造價值,基于大模型開發出來的AI應用才能滿足真實的市場需求。”李彥宏表示。

正如李彥宏所言,過去一年,大模型足夠讓人側目,例如百度文心大模型,從3.0版本到3.5,再到4.0版本的進化,在代碼生成、代碼解釋、代碼優化等通用能力方面,達到國際領先水準。

文心大模型已經成為了中國最領先、應用最廣泛的AI基礎模型。不僅如此,相比一年前,文心大模型的算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。

但僅靠大模型還不足以催生出新的業态,就像網際網路起初隻是一種技術概念,而網際網路應用融入到千行百業的場景,造就了如今耳熟能詳的網際網路巨頭。“他們”沒有發明網際網路技術,也沒有在網際網路的底層基礎設施做文章,卻是把網際網路用得最好的代表。

百度為開發者提供的大模型,就像是過去的網際網路,百度有動力也有必要,提供盡可能好的大模型,進而為大模型應用開發者打好基礎。

再不做AI應用,大模型靠什麼赢?

可以想象,百度沖在大模型第一線,踩坑是免不了的。李彥宏也直言,百度“踩了無數的坑,交了高昂的學費”,得出了一些基于大模型開發AI原生應用的具體思路和工具,直接分享給行業。

第一是MoE。未來大型的AI原生應用基本都是MoE架構,這裡所說的MoE不是一般的學術概念,而是大小模型的混用,不依賴一個模型來解決所有問題。但什麼時候調用小模型、什麼時候調用大模型、什麼時候不調用模型,要針對應用的不同場景做比對。

第二是小模型。小模型推理成本低,響應速度快,在一些特定場景中,經過SFT精調後的小模型,其使用效果可以媲美大模型。

“這就是我們釋出Speed,Lite、Tiny三個輕量模型的原因。我們通過大模型,壓縮蒸餾出來一個基礎模型,然後再用資料去訓練,這比從頭開始訓小模型,效果要好很多,比基于開源模型訓出來的模型效果更好,速度更快,成本更低。”李彥宏說。

第三是智能體。智能體是當下很熱的一個話題,随着智能體能力的提升,會不斷催生出大量新的應用。

智能體機制,包括了解、規劃、反思和進化,它讓機器像人一樣思考和行動,可以自主完成複雜任務,在環境中持續學習、實作自我疊代和進化。在一些複雜系統中,還可以讓不同的智能體互動,互相協作,更高品質地完成任務。這些智能體能力,反思、規劃、自我計劃的能力,百度已經開發并向開發者全面開放。

AI應用開發三大“神器”

李彥宏表示,大模型和生成式AI,将徹底改變開發者群體。過去,開發者用代碼改變世界;未來,自然語言将成為新的通用程式設計語言。

與之相對應地,開發者的武器庫也需要與時俱進,以适應新時代的軟體開發體系,同時針對MoE、小模型、智能體這三大方向上,百度已經做好了“開箱即用”的工具。

再不做AI應用,大模型靠什麼赢?

AgentBuilder:最主流的大模型使用方式

首先是智能體開發工具AgentBuilder。智能體可能是未來離每個人最近、最主流的大模型使用方式,基于強大的基礎模型,智能體可以批量生成,應用在各種各樣的場景。

以新加坡旅遊局為例,打開文心智能體平台,建立頁面有着零代碼、低代碼兩種模式,新手可以直接選擇“零代碼模式”,用自然語言,幾句話就能建立一個智能體,實作酒店查詢、景點門票購買等服務能力,目前百度已經跟攜程合作,提供了酒店、景點、票務等旅遊服務工具。

新加坡之外,大連、沈陽等文旅類智能體也都在文心智能體平台上線,還有知識類、創作類、學習類、娛樂類等各式各樣的智能體。

目前,已經有3萬多個智能體被建立、5萬多名開發者和上萬家企業入駐。文心智能體平台還為開發者們提供了流量變現的通路。除了百度搜尋,百度生态的其他産品,如小度、地圖、貼吧、車機等,都能接入智能體的相關能力,為開發者解決流量分發的後顧之憂,獲得實打實的收益。

再不做AI應用,大模型靠什麼赢?

有分發,就會有資料回報;有資料回報,飛輪轉起來,智能體就能夠自主疊代,越用越聰明。文心智能體平台還上線了智能體的資料分析和問答調優子產品,不久後還将有更多的新能力上線。文心智能體平台将通過分發-診斷-收益的資料飛輪,驅動智能體形成品質更優、流量更好、收益更大的正循環。

除了新加坡之外,大連、沈陽等文旅類智能體也都在文心智能體平台上線,還有知識類、創作類、學習類、娛樂類等各式各樣的智能體,這些都能在AgentBuilder做出來。

AppBuilder:自然語言三步就能開發一個應用

AppBuilder提前封裝和預置了開發AI原生應用所需的各種元件和架構,可以大幅降低開發門檻,不寫一行代碼,最快隻需三步,開發者就可以用自然語言開發出一個AI原生應用,并且能夠便捷地釋出、內建到各種各樣的業務環境中。

以遊樂場排隊助手為例,打開AppBuilder的開發界面,第一步先給應用起名“遊樂場排隊助手”,第二步填寫角色指令,包括調用代碼解釋器、算出在固定時間内的最佳組合、輸出結果等;第三步再插入需要的工具元件。這樣,在零代碼的情況下,一個應用就生成了。

從去年開始,百度用AI重構了百度文庫,使它成為使用者“内容生産的起點”。如今,在AppBuilder的支援下,百度文庫新推出的智能漫畫和智能繪本,更是把場景延伸到了更加有趣的跨模态創作領域。

在AppBuilder上面,百度也提供了一定的跨模态能力,開發者隻需要給一段文字,或者幾句話,就可以快速建立繪畫類的應用,像漫畫、兒童繪本等。百度文庫最新推出的漫畫生成和繪本生成功能,就利用了AppBuilder上提供的這類元件。

從行業視角來看,百度AppBuilder具備兩個明顯優勢:

一是功能強大。依托文心4.0對指令的了解和遵循能力,百度AppBuilder能保證冷啟動狀态下就能達到一個不錯的水準,不會因為效果差,再花很長時間去調優,大大降低了開發門檻。

依托檢索增強技術RAG,在知識問答等典型場景,問答準确率和友好回複程度都達到了95%以上,大幅超越其他同類産品。AppBuilder還提供豐富完整的元件工具,包括百度搜尋等基于百度多年技術積累的AI能力元件、大模型能力元件,還有百度獨家開放的業務元件等55個元件。

此外,一些主流場景的第三方API,比如航班查詢、論文查詢等,百度也有提供,最新支援了自定義元件,客戶可以直接對接自己專有的任何工具和資料。這些豐富的元件,共同支撐起了AI原生應用的高效開發。

二是簡單易用。使用AppBuilder,隻需三步即可快速建立應用、一鍵分發。百度也支援開源的SDK,友善大家進行二次開發。

再不做AI應用,大模型靠什麼赢?

ModelBuilder:高效低價生産模型

ModelBuilder是更适合專業開發者使用的工具,它可以根據開發者的需求定制任意尺寸的模型,并根據細分場景對模型進一步精調SFT,進而能達到更好的效果。

為了友善專業開發者快速上手,ModelBuilder預置了最全面最豐富的大模型。包括了ERNIE3.5和ERNIE4.0旗艦版大模型,它适合通用的複雜場景,能力強大;

此外還有三個輕量級的大模型,Speed、Lite、Tiny;以及兩個垂直場景的模型——ERNIE Character适合角色扮演,ERNIE Functions适合對話或問答場景中的外部工具使用和業務函數調用。當然也包括國内外第三方主流模型,總數量達到77個,ModelBuilder是國内擁有大模型數量最多的開發平台。

以小度添添AI機器人日程規劃為例,背後調用了不同的模型。先是由小模型ERNIE Tiny執行了“模型路由”的工作——把晨跑中的天氣問題,配置設定給了基于ERNIE Lite打造的精調模型,快速查詢出了氣溫25度、天氣晴朗這些資訊;同時,又把更複雜的日程安排,配置設定給了性能最好的大模型——文心4.0,來計算一天各項事項安排。

ModelBuilder的關鍵是高效低價生産模型的能力。企業客戶可以根據需要,兼顧效果、響應速度、推理成本等各種考慮,裁剪出适合各種場景的更小尺寸模型,并且支援精調和Post-pretrain。

通過降維裁剪出來的模型,比直接拿開源調出來的模型,同等尺寸下,效果明顯更好,同等效果下,成本明顯更低。

AI應用繁榮,大模型才能再進化

大模型到了聚合生态力量的新階段,無論是國内還是國外,頭部廠商都在試圖打造新的大模型生态,AI應用的繁榮不僅能夠證明大模型的價值,也能夠反過來推動大模型的再進化。

當AI應用大量被創造,越來越多的資料被生成和收集,模型有更多的機會學習到不同場景下的應用知識;規模化帶來專用硬體的普及和性能提升,使得訓練和運作大模型變得更加可行和高效;多樣化的應用場景帶來正向商業收益,商業成功将轉化為AI應用和大模型的資源。

百度文心大模型正在走上這一條路,用大模型和AI應用的互相促進,實作大模型生态的正向商業循環。

李彥宏表示,文心大模型已經成為了中國最領先、應用最廣泛的AI基礎模型。百度在晶片、架構、模型、應用這四層架構上有着全棧的布局,通過端到端優化,不斷地把成本打下來,讓更多人都可以高效、低價地用大模型來做AI應用,通過端到端優化能力,不斷提高文心大模型和文心一言的效率。

“實戰是大模型最好的訓練場,龐大的調用量将給予文心大模型更多回報,反向促進了文心大模型的能力提升,形成飛輪效應,進一步擴大文心大模型和國内同行的差距。”他說。

再不做AI應用,大模型靠什麼赢?

文心一言從去年3月16日首發,在一年零一個月的時間裡,使用者數突破了2億,每天API的調用量也突破了2億,服務客戶數或者說企業達到了8.5萬,利用千帆平台開發的AI原生應用數超過了19萬。

百度一并釋出了文心大模型4.0的工具版,使用者可以在工具版上體驗代碼解釋器功能,通過自然語言互動,就能實作對複雜資料和檔案的處理與分析,還可以生成圖表或檔案,能夠快速洞察資料中的特點、分析變化趨勢、為後續的決策提供高效精準的支撐。

此外,創業者生态也是大模型的有生力量。去年5月份,百度啟動了“文心杯”創業大賽,第一屆“文心杯”創業大賽,收到了近1000支創業團隊報名,百度為其中的15支優勝團隊,提供了近億元的投資支援,并且在技術、團隊和資源上持續提供全方位扶持。

李彥宏在現場宣布,第二屆“文心杯”創業大賽正式啟動,本次将擴大項目篩選範圍、設定分賽場,面向全球市場及高校學子,招募創業創新團隊。

隻要創業方向是AI原生應用,都可以在大賽官網報名參賽,同時百度也加大了對創業者的支援力度,提供更充足的投資資金、更豐富的業務資源,還首次設立了“特别大獎”,特别優秀的項目将有機會獲得最高5000萬人民币的現金和資源支援。

無論是成熟的“格子衫”,還是年輕的臉龐,都是中國大模型産業的一分子,百度通過AI應用開發三大“神器”,展示出了一幅通向大模型産業未來的道路。這條路,有百度,也有千千萬萬的開發者群體。

繼續閱讀