百度大模型這一年：文心一言國内首個使用者破億，飛槳開發者超千萬

機器之心原創

作者：杜偉、澤南

2023 年，AI 大模型的最後一波突破來了。

文心一言使用者規模破 1 億，飛槳的開發者數量達到 1070 萬。

隻用短短兩個月，文心大模型 4.0 整體效果又提升了 32%。

2023 年 12 月 28 日，在剛剛過去的 WAVE SUMMIT+ 2023 深度學習開發者大會上，百度揭幕了文心大模型與深度學習平台飛槳的一系列新進展。

在大會現場，百度的示範呈現了基于大模型進行 AI 原生應用開發的新方法和新思路。

想開發一個 AI 原生應用，一行代碼也不需要：基于星河社群大模型工具中心「多工具智能編排」開發模式，我們可以從頭開發完成一款內建圖文識别、問答、翻譯、播報等多模态全功能的「旅行助手」應用。

假如你要到瑞士旅遊，隻需要上傳一本旅遊攻略的和自己的旅行計劃，就可以建構起一個有關本次旅行的知識庫，然後讓它回答你關于旅行中的各種問題。

當然這個旅行助手能做的還有更多。基于文心大模型體系，挂載 OCR、語音合成等各種工具，它就可以幫你識别出照片中德文提示的内容：

或是對景點照片進行一番 AI 解說。

大模型能力的進化與生态建構，已經讓基礎模型發展進入了新的階段，「全民定制個人 AI 應用」的時代似乎正在到來。

突破上億使用者規模，能力持續進化的文心一言，最近在全球科技公司「AI 軍備競賽」的背景下風評持續走高，展現了強大的技術實力。本次大會上，文心大模型以及飛槳披露的技術和生态進展，更關乎千萬開發者的切身使用體驗和權益。

文心大模型 + 多工具智能編排，建構更強的 AI 應用

2023 年 10 月 17 日，迄今為止綜合實力最強的文心大模型 4.0 面世，其了解、生成、邏輯、記憶四大能力得到顯著提升，大語言模型正在為通用人工智能帶來曙光。

在 WAVE SUMMIT+ 2023 上，百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜分享了文心一言的使用者使用洞察。她表示，2023 年文心一言已完成了 37 億字的文本創作，生成了 3 億行代碼。

在過去一年裡，「文心一言」的基礎模型，文心大模型持續釋出了 3.5 和 4.0 兩個大版本，效果一直急速提升。

大模型技術突破之後，AutoGPT 為代表的智能體概念迅速進入了人們的視線，開發能夠解決和适應複雜工作的多任務智能體（Agent）成為了研究者們重要的目标。AI 智能體對于大模型的應用至關重要，它可以連接配接大量 App，自主地完成任務，大幅提升系統的智能化水準。

文心一言的智能體能力是如何建構的？具體來說，文心一言中現在有兩個系統：系統一是以模型和記憶為基礎的，給予使用者像知覺這樣直接的答複生成；系統二加強了了解、規劃、反思、進化等一系列的能力。

在系統二的加持之下，文心一言現在更善于靈活地運用知識與各種工具，能夠幫助使用者層層遞進地剖析問題，也具有更強的主動交流能力。

基于智能體的技術理念，百度已經開發了文心一言的智能體模式，面向專業版使用者即日起進行邀請測試。

在 2023 年 8 月份的 WAVE SUMMIT 上，百度已經釋出了基于「文心一言」的新開發範式。到目前為止，基于文心一言的應用已經達到了 4000 個以上，涵蓋了各類應用場景。這一次，百度圍繞社群生态，希望能夠賦能 AI 原生應用開發者，對星河社群進行了一系列的新更新。

星河社群提供異構算力支援和更高效的通用元件，面向開發者更新了飛槳産業級模型庫和全流程開發工具鍊，實作低成本開發 AI 應用。最新推出的星河社群大模型工具中心，又給開發者帶來了功能強大的 AI 原生應用建構能力。

吳甜介紹稱，全新釋出的星河社群大模型工具中心，集合了百度人工智能多年來的建設成果，包括飛槳産業級模型庫、百度大腦 AI 能力、文心一言工具等，同時支援生态工具接入，提供了對使用者非常友好的可視化互動界面，參數配置靈活多樣自由選擇，預覽效果實時呈現。

這一系列更新，讓星河社群為開發者提供了「AI 原生應用創新的全要素」，包括開發、體驗、推廣、交流、學習一體化服務。

在生态共創方面，百度此前推出的文心大模型「星河」共創計劃，将大模型相關的 AI 應用、工具、資料資源都構築起全面的生态，此次大會百度重點介紹了資料方面的最新進展。

為了增強專業能力，文心一言正式「拜師」，首批 10 位「文心導師」是其所在行業領域的頂尖學者和專家，将幫助文心一言加強在各個專業領域的認知。此外還有一位特殊的導師 ——《辭海》，文心一言與上海辭書出版社深化合作，《辭海》的龐大資料已經融入文心基座大模型，增強了文心一言的學識，更好地為使用者提供服務。

大模型時代，用智能的開發工具

大模型的技術突破提高了前沿研究的強度，同時也在降低普通人使用 AI 的門檻。

正如百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰所言，文心一言這樣的人工智能技術，本質上是提升生産力的工具，也會成為一個通用的賦能平台，加速産業智能化變革，創造巨大的商業價值。

大模型加持的開發工具鍊，帶來三大開發新範式，降低 AI 技術的門檻，會催生出越來越多原生的 AI 應用。

百度 AI 技術生态總經理馬豔軍現場用三個案例進行了詳細的闡述。

首先是全面更新的百度智能程式設計助手 Comate。我們了解到，百度内部已經有超過 20% 的代碼由 Comate 編寫。此外還有 8000 家左右企業在使用 Comate SaaS 版服務，整體代碼生成采納率更是超過了 40%。

不過，此次 Comate 最亮眼的還是新功能 AutoWork，它可以基于文心大模型來拆解複雜任務，将開發者從提出需求到完成編碼的全過程大大縮短，效率自然而然得到提升。

百度現場示範了 2 分鐘開發一個領取 Comate 試用權益的程式，開發者隻需要提出需求，剩下的由 Comate 的 AutoWork 完成，制定計劃，生成代碼。

在 Comate AutoWork 新功能之外，飛槳低代碼開發工具 PaddleX v2.2 也正式釋出，飛槳低代碼開發工具 PaddleX v2.2 在飛槳開發套件能力基礎上，充分結合文心大模型，可以高品質完成以前很難解決的産業痛點問題，大幅提升開發效果和效率；通過提供圖形界面開發模式，進一步降低了 AI 技術的使用門檻，目前已支援 40 多個産業級精選模型，覆寫 10 大主流 AI 任務，并适配國内外主流 AI 硬體，支援雲端和本地端離線使用。

現場的示範是大宗商品關鍵交易資訊抽取，針對煤炭領域的專業術語，解決了關鍵資訊抽取不準确的問題，實作開發效率和效果的雙雙提升。

原來 AI 開發者特别困難的任務，用大模型 Prompt 的方法，就能實作效果的大幅度提升。

最後，面向生态的文心一言開發機制可以極大地提升開發效果，帶來非常棒的使用體驗，同時有助于更高效便捷地開發出更有創意的 AI 原生應用。

針對「制作全國 TOP10 省份常住人口随時間動态排序的圖表」這樣一個乍看起來并不特别複雜的任務，馬豔軍現場直接應用文心一言插件「代碼解釋器」，prompt 輸入需求，就自動生成代碼和實作了。

現在開發者借用文心一言的開發機制非常簡單地通過類似的功能做出來一個非常好用的應用，體驗看起來絲毫不遜于專業的工程師開發出來的應用。

文心一言開發機制的更新，實際上是百度在進一步降低 AI 應用開發的門檻。這涉及了從服務開發、注冊接入、效果調優到上線分發等四個環節的難題，百度有實力也有意願這樣做，是希望能湧現出越來越多高品質的應用。

基于文心一言開放的一整套開發機制，不管是哪個類型的開發者，不管技術棧是哪個領域的，都可以使用這套開發機制去開發插件，做多工具智能編排，開發出自己高品質的應用。

馬豔軍表示，「随着開發範式的改變，我相信這是對廣大開發者最好的時代，未來會湧現出越來越多高品質的 AI 原生應用。」顯然，百度已經為此做好了準備。

飛槳開源架構 v2.6，實作大模型套件全流程優化

文心一言的能力處于業界大模型領域的第一梯隊，除了一直深耕領先 AI 技術之外，也要歸功于飛槳産業級深度學習開源開放平台。在 WAVE SUMMIT+ 2023 上，百度宣布飛槳開源架構更新至最新的 2.6 版，對支援大模型開發進行了一系列硬核提升。

馬豔軍在大會現場表示，飛槳開源架構 v2.6 在開發體驗提升方面實作了高擴充性 IR、自适應圖建構機制和動靜統一自動并行程式設計等核心功能。

在提升基礎能力後，面向大模型的建構，飛槳開源架構 v2.6 進行了全流程的優化。簡而言之，在飛槳開源架構 v2.6 上，大模型套件從預訓練、精調、壓縮、推理到部署的所有流程，都有了全面的優化。

對于大模型技術而言，充分利用硬體算力至關重要。飛槳此次更新了硬體适配方案，可以更好支援不同硬體廠商的産品，進行靈活定制，軟硬協同的深度優化。

結合文心大模型的适配和優化，飛槳和硬體廠商正在共同建構「硬體 Transformer 大算子加速庫」，加速完善業界的軟體棧體系。

結語

在大模型時代，技術的發展速度很快，在 WAVE SUMMIT 的每次釋出中，我們都能感受到這種快節奏的進步：自 2019 年 3 月起，文心大模型經曆了從 1.0 到 4.0 的快速發展曆程，一年兩次的大會到今天也已辦到了第十屆。

我們也見證了飛槳深度學習開源開放平台的不斷繁榮。截至目前，飛槳平台已經凝聚了 1070 萬開發者，服務 23.5 萬家企業，并在其上建構了 86 萬個模型。在這個越來越強大的平台上，百度關聯各方推動 AI 技術和生态的繁榮發展，加速應用落地。

百度對人工智能技術和産業趨勢的前瞻判斷，正在不斷指引技術創新和産業實踐的方向。

王海峰在此次大會的開場演講中表示：「深度學習平台加上大模型，貫通了從硬體适配、模型訓練、推理部署，到場景應用的 AI 全産業鍊，夯實了産業智能化基座。今年大語言模型的出現，為通用人工智能帶來了曙光。」

從喊出深度學習架構作為「智能時代的作業系統」，到雲智一體加速的産業智能化，再到貫通硬體到應用的 AI 全産業鍊，如今的百度已經利用自身技術優勢，建構起了覆寫全行業、低門檻的開發體系，并在大模型時代充分發揮了優勢。

在持續技術創新和賦能産業的發展曆程中，飛槳自身也在不斷更新，從深度學習架構，到平台生态，發展成為技術領先、功能豐富的産業級深度學習平台。

或許用不了多久，這一輪 AI 突破帶來的變革将會觸及到更多人，我們将見證生成式 AI 對生産力和創新的颠覆。

在這場變革中，相信我們會看到越來越多的 AI 原生應用，來自百度，來自文心一言。

百度大模型這一年：文心一言國内首個使用者破億，飛槳開發者超千萬

繼續閱讀

探索大語言模型：了解Self Attention| 京東物流技術團隊

谷歌I/O開發者大會總結：Gemini 1.5 Pro大模型、全新TPU晶片、多項AI功能

西方破防：月球是全人類的資産，要共同開發，中國不能據為己有！

中風和吃堅果有關？醫生告誡：老人愛吃堅果，但這幾種不能吃！

美國專家：月球是全人類的資産，要共同開發！中國不能獨占月球

瓜子是肺癌的“隐藏兇手”？注意：不想肺癌找上門，這類堅果少吃

蔣介石孫子召開釋出會，申請父、祖移靈大陸，說了兩句話令人唏噓

vivo發高端新機，卷上影像算法，也卷大模型

中國探月計劃引發西方集體酸溜溜，嫉妒到口不擇言要共同開發！

史玉江到垣曲經濟技術開發區進行現場辦公

查理芒格已走，這100個思維模型永存

位元組跳動打響大模型價格戰？價格比同行低99.3%，稱不用虧損換收入

華為HDC 2024大會将發盤古大模型5.0丨馬斯克xAI計劃融資60億美元

西方破防：月球是人類共同所有，中國不能單獨占有，要共同開發！

2024熱潮繼續！本地跑AI大模型，解鎖無網盡享它的魔力！

vivo釋出首款Ultra版手機藍心大模型更新為多模态