華為決定創新，不走ChatGPT的正常路徑

在今年上半年的喧嚣之後，ChatGPT引發的大模型熱潮正在經曆第一輪冷靜期。今年6月，ChatGPT的通路量首次出現了月度下滑，同時，年初接入ChatGPT聊天功能的新版必應（Microsoft Bing）的市場佔有率也在近期出現了下滑，甚至低于改版之前。

這些迹象都在表明，大模型賽道的“看熱鬧”階段已經過去，市場對大模型的實用性正在提出更高的要求。與消費端市場的熱烈歡迎相比，人們現在更關心的是大模型如何在商業端行業中實際應用，僅能“聊天”的大模型已經無法滿足市場需求。

新的競争格局正在形成。在剛剛結束的人工智能大會上，一系列針對不同行業和場景的大模型開始嶄露頭角。華為、騰訊、阿裡、科大訊飛等都在努力讓大模型在商業層面落地。與以往“寫詩畫畫”的賣點相比，人們現在更關心的是如何讓大模型幫助使用者解決實際問題。

可以說，主流大模型的參與者們終于開始腳踏實地，準備做實事了。

華為作為國内最早投入大模型研發的科技巨頭，早在2021年就推出了盤古大模型1.0。然而在今年的行業熱潮中，華為卻遲遲沒有推出自家的主力産品。直到7月6日世界人工智能大會，華為輪值董事長胡厚崑才正式預告了盤古3.0的釋出，并提到，未來人工智能的發展，關鍵是要“走深向實”，賦能産業更新。7月7日，在華為雲開發者大會（HDC2023）上，華為雲正式釋出了盤古大模型的3.0版本。

與ChatGPT不同，盤古3.0并不是一款主打“聊天”的大模型，華為甚至表示，盤古大模型在一段時間内都不會對個人使用者開放，這也不是産品的主要方向。盡管華為并未透露這個時間具體是多久，但至少可以證明，“聊天”并不是盤古大模型研發的重點。

“我們從來沒有和ChatGPT比較過，沒有叫盤古Chat，也沒有叫Chat盤古，我們沒時間聊天”。華為常務董事、華為雲CEO張平安在7月7日的媒體溝通會中提到。

華為介紹說，盤古3.0大模型不是一個單獨的大模型，而是一系列大模型叢集和工程應用平台的總稱，共分為三個層級，包括底層（L0）的通用大模型，第二層（L1）的行業大模型和第三層（L2）的細分場景模型。

可以說，在大模型賽道的參與者們都在争相比拼誰更擅長寫詩畫畫的時候，盤古3.0選擇了一條全新的路，它的發力點不僅在于通用能力的疊代，同時也聚焦于專業能力的進化，以滿足不同行業和場景的多樣化需求。

華為顯然已經認識到，如果大模型想要真正落地，就必須解決實際需求。大模型必須在不同行業和場景中具有高度專業的實用能力，才能生存下去。

在全球範圍内，生成型AI的發展速度讓人瞠目。許多科技巨頭都在等待着這個技術跨越一個特定的智能化節點，進而徹底改變整個世界的生産方式。在這次大模型團戰中，華為作為最後一個進入此賽道的國内科技巨頭，選擇從其最擅長的To B市場入手。他們明白，盡管To C市場看似熱鬧，但大模型必須深入實際，才能在商業層面落地。華為的大模型，盤古3.0，不僅僅是為了娛樂，它是為了創造實實在在的價值。

盤古3.0是華為在大模型研發上的一次重大更新。與ChatGPT走的路線完全不同，盤古3.0經過了三年的打磨和更新。在架構上，盤古3.0創新地采用了三層架構，包括通用大模型、行業大模型和場景模型，每一層都有其獨特的功能特性。在訓練方法上，盤古3.0也更新了一套從通用到專精的訓練模式，包括預訓練、特調訓練和強化學習。

此外，盤古3.0還是行業中首個完全分層解耦的大模型叢集，它的各項能力之間可以獨立運作，互不幹擾，以滿足不同行業和客戶的定制化需求。這種分層解耦的設計讓行業客戶可以像選藥一樣，根據需要選擇大模型的不同能力。

盤古大模型的核心定位是對各行業進行賦能。為了實作這個目标，他們在資料和算力上進行了大量的投入。在資料方面，他們使用了超過3萬億tokens和超過1000+TB的資料進行訓練。在算力方面，他們基于華為昇騰AI算力叢集進行訓練，提升了模型訓練效率。

在多重創新下，盤古大模型在多項能力上實作了行業領先。例如，他們的NLP大模型是業界首個千億參數的中文大模型，具備強大的文本了解和生成能力。他們的CV大模型則首次兼顧了圖像判别與生成能力，在ImageNet 1%、10%資料集上的小樣本分類精度上，達到了業界最高水準。

總的來說，華為的盤古3.0大模型是一次革命性的疊代。它不僅僅是一個聊天機器人，而是一個能夠深入實際，為各行各業提供解決方案的大模型。在未來，我們期待看到更多像盤古3.0這樣的大模型，能夠更好地服務于工業社會和農業社會，推動整個世界的發展。

深化行業應用，實作場景落地

在全球的大型模型競争中，行業化已成為關鍵的焦點。對于誰能真正了解行業需求并解決問題，這将決定誰能最先實作大模型的商業化。

華為，作為全球最大的通信裝置制造商，擁有數十年的政企市場積累，使其在行業深度上具有巨大優勢。近年來，華為成立的20個大軍團，深入到礦山、煤井等行業，以進一步服務政企客戶。

華為雲CEO張平安在7月7日的媒體群訪中提到，華為最大的優勢在于，他們的科學家和數學家可以深入到實際的工作場景中，解決行業的實際問題。他們敢于深入到田間地頭，這就是華為在大模型上的最重要優勢。

在實際應用中，華為已經在許多行業中實作了大模型的應用。例如，在政務市場，華為的盤古政務大模型通過對超過20萬條政務資料進行精調，能夠精準了解群眾咨詢意圖。

在金融領域，盤古金融大模型通過對銀行的各種操作、政策、案例文檔進行預訓練，能夠為櫃台從業人員自動生成流程和操作指導，大大提高了工作效率。

此外，盤古大模型也在煤礦、鐵路、藥物研發等行業中推出了專用的行業大模型，進一步幫助行業提升效率。華為的目标是讓每個行業、每個人都擁有自己的"專家助手"。

華為雲CEO張平安表示，他們始終堅持AI for Industries的戰略，在深耕行業的道路上不斷前行。他堅信大模型将重塑千行百業，而每一個開發者，都将是改變世界的英雄。

在行業大模型之上，華為還開發了更細分更具體的場景模型，這些模型專門為了解決特定問題而生，是"開箱即用"的。盤古大模型目前已經在超過100個實際場景中取得應用，降低了人工智能的開發門檻，平均節省研發成本80%以上。

無疑，大模型的發展将帶來一場科技革命，将徹底改變整個工業社會。華為作為一家企業，除了研究和工程化以外，更需要探索新的大模型商業模型，保證大模型的商業成功。

現在，華為将盤古大模型分為L0到L2的三層模式，并在完全解耦的基礎上，針對不同客戶的需求進行拆分組合，就是為了進一步探索大模型商業化的邊界。

華為，作為中國AI行業的領軍企業，已經邁出了大模型研究的重要一步。其盤古3.0的問世，雖晚于其他競争對手，但背後的研究積累和深厚的人才儲備，都讓華為在大模型的道路上走得更穩健。

華為早在2020年就預見了AI行業的兩個主要發展趨勢：一是小模型向大模型的轉變，二是AI與傳統科學計算的融合。是以，華為提出了六個子課題，其中包括高度與大模型相關的模型模高計劃和萬物預視計劃。盡管ChatGPT的推動力不容忽視，但華為在GPT-3釋出前就已經開始了大模型的研究。

華為的盤古大模型團隊擁有深厚的人才儲備，超過一半的團隊成員為博士學位持有者。這個年輕、技術過硬且敢于創新的團隊，是華為大模型研究的堅實後盾。

華為的未來發展方向，并非關注模型的參數大小，而是其在各行業的滲透率。除了已經進入的鐵路、煤礦、金融、政府等行業，還有更多的行業等待着華為的大模型的服務。

華為的優勢在于其全棧研發能力。在大模型的研究中，華為從算力到算子，再到架構、開發平台等都進行了自主創新，并沒有依賴開源技術。這一切都得益于華為在AI底座、算力和晶片等根技術上的深厚積累。

華為目前在AI發展上的主要着力點是：一方面打造強大的算力底座，做好産業基礎設施；另一方面從通用大模型到行業大模型，服務好各行各業。

華為的大模型盤古3.0釋出時，還公布了全新的LOGO，象征着盤古開天地，萬物新生的意義。這也預示着華為的大模型将在未來的發展中，肩負起重要的使命。

華為決定創新，不走ChatGPT的正常路徑

繼續閱讀

ChatGPT沒有做的AI搜尋，是不是下一個戰場

最強OpenAI釋出新ChatGPT-4o，AI領域的突破情感識别+視覺了解

OpenAI一夜幹翻語音助手！ChatGPT學會看螢幕，現實版Her來了

突然殺出！中國版阿裡ChatGPT來了！我忍不住去注冊體驗

胡錫進要失業了？網友用ChatGPT模仿“胡編體”寫作，笑瘋

從人機互動角度聊聊ChatGPT-4o

iOS 版 ChatGPT 更新支援 App 首選語言設定中文

如何讓ChatGPT更“懂你”

生成式人工智能的風險與治理——以ChatGPT為例

這才是ChatGPT4o最大的更新！釋出會居然隻字未提！GPT-4o的識圖能力居然這麼強！連人像照都可以看出是誰👍我這裡

ChatGPT 新功能上線：聊天時可直接選擇 OneDrive 等網盤檔案｜懂點AI

ChatGPT能夠幫助醫生準确分析臨床研究和病案記錄

ChatGPT 日耗電超 50 萬度，卡死AI發展的竟然是能源？

恐怖！懇求斯坦福教授幫它“越獄”？ChatGPT-4已出現自

和ChatGPT搞黃色的年輕人

OpenAI前董事揭示奧特曼罷免内幕：董事會是從X上知道ChatGPT已釋出的