AI大模型駛入落地深水區，解密京東雲破局的殺手锏

智東西

作者 | 徐珊

編輯 | 雲鵬

2023年，科技圈最火的話題莫過于AI大模型，AI大模型已然成為了各大廠商們在新一輪AI浪潮中争奪的入場卷之一。

在聊天機器人ChatGPT引爆的第三次AI浪潮中，微軟、谷歌、百度、阿裡等科技巨頭們紛紛重金砸向AI大模型領域。同時，不少AI界大牛紛紛從研究所走出，開始自己的創業道路，産學研界均高度關注此次AI浪潮所帶來的技術震蕩。

據不完全統計，到7月15日為止，國内10億級參數規模以上AI大模型已釋出了80個。集體的狂熱之下，難免有泡沫浮現。我們發現不少AI大模型在參數上翻倍增長，從數十億級增長到數千億級，但是仍停留在研究階段，短期内難以直接帶來實際的産業價值。

國際調研機構IDC預計，國内AI市場規模在2023年将超過147億美元，到2026年這一規模将超過263億美元。在巨大的藍海市場面前，如何将AI大模型發揮出實際的産業價值，成為各家手持大模型的企業面臨的關鍵一考。

百花齊放的AI大模型時代，企業應該如何選擇适合自己的大模型？從研究院到産業中，AI大模型還需要克服哪些難關？AI大模型究竟能給産業帶來哪些價值？我們和多位産業人士交流後，理清了AI大模型時代落地的關鍵。

一、擁抱大模型，企業要多問價值

“在第三代AI發展中，推動AI創新應用和産業化成為AI發展的關鍵。”中國科學院院士、清華大學人工智能研究院院長張钹提到，第二代AI發展正是因為與應用脫軌，導緻其很難在産業中大規模的應用。

随着越來越多的AI大模型走出實驗室，AI大模型不再作為實驗室的項目，而逐漸開始成為産品，其能夠發揮的價值愈發被看重。如何更好地将AI大模型發揮出其應用的價值成為其走向市場最為關鍵的一步。

目前，大多數的AI大模型通過聊天機器人或生成式内容平台的形式展現其在語義了解、多輪對話能力，但對于一些專業問題，仍難給出較為準确的答案，這也是未經過專項訓練的通用AI模型常遇到的問題之一。

京東集團技術委員會主席、京東雲事業部總裁曹鵬曾舉例，像是在聊天場景中，如果接入通用大模型如GPT等，使用者對一些搞笑回答可能擁有較強的包容程度，對錯誤回答一笑了之。但如果像是在金融、醫療等嚴肅應用場景中，錯誤的AI回答則會影響使用者的财産甚至是生命的安全。

不僅如此，在訓練大模型的時候，可靠的資料來源也是影響AI大模型能否更好适配産業的影響因素之一，以提高AI的可信度。

“現在的AI大模型很少有走到商業化程序的。從商業角度來看，大模型的落地才剛剛開始。”一位資深AI産業人士說。他提到目前很多AI大模型公司僅處于釋出大模型階段，其銷售和服務業務落地還需一段時間。

在“千模大戰”之後，AI大模型開始走向産業，廠商們開始嘗試通過AI大模型來訓練出适應不同場景的産業AI模型，讓通用AI大模型轉換成适合産業應用的模型，帶來降本增效的成果成為目前不少廠商重點發力的方向。

剛剛結束京東雲峰會上，京東明确将産業價值放在首位。京東集團CEO許冉表示，“大模型真正實作自己的價值，一定是在産業應用中”，并提出一個公式：大模型的價值=算法×算力×資料×産業厚度的平方。實作産業價值，才是大模型競争這場長跑的終點線。

二、打造AI專家，高品質資料、産業基礎成大模型接軌産業關鍵

究竟什麼樣的大模型能夠幫助更多企業更快、更友善地接軌新一輪人工智能的浪潮？曹鵬認為至少要有兩大要素，高品質的資料和較強的供應鍊能力。

在AI大模型變成産業大模型的過程中，其所需要的訓練資料不再是通用資料集，其目的也不再是教AI如何擁有更好的認知能力，而是讓AI快速在某個領域成為“專家”。想要實作這一步，則需要高品質的行業資料庫，才能訓練出精度加高，較為資深的AI專家。

但并非每家大模型公司都有能力做到這一點。像是相對一些此前紮根在垂類領域的企業，甚至是剛剛成立的一些創企團隊，難以擁有不同場景的産業資料資源，也就很難加入到這場大模型産業落地的競賽中。

相較而言，曾紮根在産業多年等大廠，如京東、騰訊、阿裡等，由于業務覆寫廣泛，産業資源積累雄厚，是以原生的、高品質的産業資料集将成為其在大模型産業落地競賽過程中制勝的關鍵法寶。

拿京東舉例，京東旗下擁有京東物流、京東健康、京東商城等多個核心業務，涉及零售、物流、科技、健康、工業、産發等多個領域。這些場景積累下的每年數百億條互動資料，就成為訓練大模型的寶貴養料。據悉，訓練言犀大模型的資料庫，就由70%通用資料和30%供應鍊原生資料組成。

“在資料層面，像是商品的優先推薦、金融産品的選擇政策、理财的一些隐藏規則、物流的優化體驗等，這些資料相對标準通用大模型存在比較明顯的一個差異。”曹鵬提到京東在此次訓練京東言犀大模型中，不但使用了訓練大模型所使用的标準資料集，還利用京東多年在零售、健康、物流、金融所積累的原生資料集，進而更好地通過特定場景去訓練相關産業模型。

企業想要訓練出合适落地産業大模型，不但考量企業對産業的認知寬度，還考查企業對産業的認知深度。就像當人們在做某一個判斷時，不僅需要從某個問題本身出發，還需要全局考量對整個問題前後的背景、所涉及的情況。

要想将同樣的能力遷移到AI上，教會AI擁有“大局觀”，則需要長鍊路、能夠協同處理、且動态資料回流的産業基礎能力。因為供應鍊的鍊條越長，帶來的資料相關性更高，相關性高的訓練資料越多，模型越大，才越有可能産生産業端的智能湧現。

比如說，在物流領域，當使用者想要通過AI做出是否增添新的物流倉庫決策時，AI需要從産品供應時間、人力成本、物流成本等等多個供應鍊角度去思考和評定情況。當AI能夠拿到更多的産業資訊，對物流整體産業的供應鍊了解更加清晰，考量的角度越多，其能夠給出的判斷更加準确。

同時，因為有實地落地場景，大模型在垂直領域的應用還會誕生更多精準資料和産業Know-How，形成發展的正循環。

由此可見，長鍊路、複雜場景、豐富資料的數智供應鍊，将會是大模型絕佳的“訓練場”和創造産業價值的“應用場”。

三、率先從健康、金融和零售場景突破，京東将大模型送入企業内部

在這場遍及全球的大模型落地之戰裡，企業對大模型的研發和應用程序離不開産業積累。

過去京東憑借着對供應鍊的洞察，打通企業、物流和供應鍊之間壁壘，疏通出一條暢通無阻的發展道路，從此在電商站穩了腳步。這一次，京東也同樣憑借其在供應鍊紮根多年，擁有豐富的供應鍊資料和行業Know-How，進而直接行業和大模型結合的痛點，打造出不少的大模型落地應用。

在京東雲峰會上，京東展示了其基于大模型場景開發的多個應用場景，如物流、金融、零售、健康等，并已經基于特定場景研發出相應的産業大模型。

像是在物流場景中，京東展示了其如何通過京東物流超腦内的倉内智能互動模組化，實作對倉庫布局問題的智能化原因分析。

當使用者輸入分析在今年雙11大促的布局堵點後，系統通過分析，給出效率堵點為地狼貨架數目不夠、建議增加一排貨架等建議。這極大地減少了傳統複盤調研時，所需要花在調研、分析，測試上的成本。

在健康場景中，京東已基于千億級的言犀大模型訓練出相應的醫療大模型：京醫千詢。該模型将在遠端醫療診斷、提供診斷和治療決策、醫療案例咨詢搜尋等環節，幫助醫療從業者在遠端醫療環境中更準确地進行診斷、治療和提供咨詢服務。

據悉，京醫千詢大模型内涉及上千種常見疾病，并采用醫療專家團隊參與設計的20種品質評價名額來保障其安全性。目前，該模型還在京東内部應用以及優化階段，将在明年上半年提供服務。

在金融領域，AI營銷營運平台可以讓使用者通過寥寥幾句的AI對話，一鍵在平台上營銷活動。過去需要5類職能人員、2000次人機互動的工作量，如今縮短到1人在50次人機互動以内就能完成，整體的營銷方案的生産效率，整體提高百倍。

在峰會現場，京東還現場展示了如何借助京東雲AIGC内容營銷平台，從一張普通的商品圖出發，快速生成電商營運需要的商品主圖、營銷海報圖和商品詳情圖等系列圖檔。相較過去人工作圖，商家們制圖成本下降90%，制作周期也從7天縮短到半天。

這些産品什麼時候能夠真正地服務商家、服務客戶？京東針對大模型落地節奏，做出了“三步走”規劃。目前，京東雲已經基于内部實踐建構了通用大模型言犀大模型；到今年年底這段時間，京東将經由高度複雜場景大規模錘煉，疊代出紮實的産業服務；預計在2024年初，會将大模型能力向外部嚴肅商業場景開放。

可以看到，京東在大模型領域的研發更重視為産業帶來的價值。京東正借助其在産業積累多年的技術能力，幫助企業快速找到适合自己的大模型。

結語：紮入産業深水區，京東加速大模型落地

AI大模型開始從紮堆釋出，逐漸走向落地應用。AI大模型的落地，将會影響AI在未來3-5年内，将會有多大的市場規模，以及給産業和生活帶來哪些深遠的影響。在産業數字化的長線背景下，隻有将供應鍊做透，才能将大模型做實，進而為企業帶來降本增效的成果。

在京東看來，大模型實作價值是一場長跑，釋出大模型在這場實作大模型價值的長跑中，影響甚微。我們也相信隻有真正摸索出與産業結合的方式，讓技術落地應用，才算是沖過了終點線。