天天看點

華為決定創新,不走ChatGPT的正常路徑

作者:執筆方寸AI

在今年上半年的喧嚣之後,ChatGPT引發的大模型熱潮正在經曆第一輪冷靜期。今年6月,ChatGPT的通路量首次出現了月度下滑,同時,年初接入ChatGPT聊天功能的新版必應(Microsoft Bing)的市場佔有率也在近期出現了下滑,甚至低于改版之前。

這些迹象都在表明,大模型賽道的“看熱鬧”階段已經過去,市場對大模型的實用性正在提出更高的要求。與消費端市場的熱烈歡迎相比,人們現在更關心的是大模型如何在商業端行業中實際應用,僅能“聊天”的大模型已經無法滿足市場需求。

新的競争格局正在形成。在剛剛結束的人工智能大會上,一系列針對不同行業和場景的大模型開始嶄露頭角。華為、騰訊、阿裡、科大訊飛等都在努力讓大模型在商業層面落地。與以往“寫詩畫畫”的賣點相比,人們現在更關心的是如何讓大模型幫助使用者解決實際問題。

華為決定創新,不走ChatGPT的正常路徑

可以說,主流大模型的參與者們終于開始腳踏實地,準備做實事了。

華為作為國内最早投入大模型研發的科技巨頭,早在2021年就推出了盤古大模型1.0。然而在今年的行業熱潮中,華為卻遲遲沒有推出自家的主力産品。直到7月6日世界人工智能大會,華為輪值董事長胡厚崑才正式預告了盤古3.0的釋出,并提到,未來人工智能的發展,關鍵是要“走深向實”,賦能産業更新。7月7日,在華為雲開發者大會(HDC2023)上,華為雲正式釋出了盤古大模型的3.0版本。

與ChatGPT不同,盤古3.0并不是一款主打“聊天”的大模型,華為甚至表示,盤古大模型在一段時間内都不會對個人使用者開放,這也不是産品的主要方向。盡管華為并未透露這個時間具體是多久,但至少可以證明,“聊天”并不是盤古大模型研發的重點。

“我們從來沒有和ChatGPT比較過,沒有叫盤古Chat,也沒有叫Chat盤古,我們沒時間聊天”。華為常務董事、華為雲CEO張平安在7月7日的媒體溝通會中提到。

華為介紹說,盤古3.0大模型不是一個單獨的大模型,而是一系列大模型叢集和工程應用平台的總稱,共分為三個層級,包括底層(L0)的通用大模型,第二層(L1)的行業大模型和第三層(L2)的細分場景模型。

可以說,在大模型賽道的參與者們都在争相比拼誰更擅長寫詩畫畫的時候,盤古3.0選擇了一條全新的路,它的發力點不僅在于通用能力的疊代,同時也聚焦于專業能力的進化,以滿足不同行業和場景的多樣化需求。

華為決定創新,不走ChatGPT的正常路徑

華為顯然已經認識到,如果大模型想要真正落地,就必須解決實際需求。大模型必須在不同行業和場景中具有高度專業的實用能力,才能生存下去。

在全球範圍内,生成型AI的發展速度讓人瞠目。許多科技巨頭都在等待着這個技術跨越一個特定的智能化節點,進而徹底改變整個世界的生産方式。在這次大模型團戰中,華為作為最後一個進入此賽道的國内科技巨頭,選擇從其最擅長的To B市場入手。他們明白,盡管To C市場看似熱鬧,但大模型必須深入實際,才能在商業層面落地。華為的大模型,盤古3.0,不僅僅是為了娛樂,它是為了創造實實在在的價值。

盤古3.0是華為在大模型研發上的一次重大更新。與ChatGPT走的路線完全不同,盤古3.0經過了三年的打磨和更新。在架構上,盤古3.0創新地采用了三層架構,包括通用大模型、行業大模型和場景模型,每一層都有其獨特的功能特性。在訓練方法上,盤古3.0也更新了一套從通用到專精的訓練模式,包括預訓練、特調訓練和強化學習。

此外,盤古3.0還是行業中首個完全分層解耦的大模型叢集,它的各項能力之間可以獨立運作,互不幹擾,以滿足不同行業和客戶的定制化需求。這種分層解耦的設計讓行業客戶可以像選藥一樣,根據需要選擇大模型的不同能力。

盤古大模型的核心定位是對各行業進行賦能。為了實作這個目标,他們在資料和算力上進行了大量的投入。在資料方面,他們使用了超過3萬億tokens和超過1000+TB的資料進行訓練。在算力方面,他們基于華為昇騰AI算力叢集進行訓練,提升了模型訓練效率。

在多重創新下,盤古大模型在多項能力上實作了行業領先。例如,他們的NLP大模型是業界首個千億參數的中文大模型,具備強大的文本了解和生成能力。他們的CV大模型則首次兼顧了圖像判别與生成能力,在ImageNet 1%、10%資料集上的小樣本分類精度上,達到了業界最高水準。

總的來說,華為的盤古3.0大模型是一次革命性的疊代。它不僅僅是一個聊天機器人,而是一個能夠深入實際,為各行各業提供解決方案的大模型。在未來,我們期待看到更多像盤古3.0這樣的大模型,能夠更好地服務于工業社會和農業社會,推動整個世界的發展。

華為決定創新,不走ChatGPT的正常路徑

深化行業應用,實作場景落地

在全球的大型模型競争中,行業化已成為關鍵的焦點。對于誰能真正了解行業需求并解決問題,這将決定誰能最先實作大模型的商業化。

華為,作為全球最大的通信裝置制造商,擁有數十年的政企市場積累,使其在行業深度上具有巨大優勢。近年來,華為成立的20個大軍團,深入到礦山、煤井等行業,以進一步服務政企客戶。

華為雲CEO張平安在7月7日的媒體群訪中提到,華為最大的優勢在于,他們的科學家和數學家可以深入到實際的工作場景中,解決行業的實際問題。他們敢于深入到田間地頭,這就是華為在大模型上的最重要優勢。

在實際應用中,華為已經在許多行業中實作了大模型的應用。例如,在政務市場,華為的盤古政務大模型通過對超過20萬條政務資料進行精調,能夠精準了解群眾咨詢意圖。

在金融領域,盤古金融大模型通過對銀行的各種操作、政策、案例文檔進行預訓練,能夠為櫃台從業人員自動生成流程和操作指導,大大提高了工作效率。

此外,盤古大模型也在煤礦、鐵路、藥物研發等行業中推出了專用的行業大模型,進一步幫助行業提升效率。華為的目标是讓每個行業、每個人都擁有自己的"專家助手"。

華為雲CEO張平安表示,他們始終堅持AI for Industries的戰略,在深耕行業的道路上不斷前行。他堅信大模型将重塑千行百業,而每一個開發者,都将是改變世界的英雄。

在行業大模型之上,華為還開發了更細分更具體的場景模型,這些模型專門為了解決特定問題而生,是"開箱即用"的。盤古大模型目前已經在超過100個實際場景中取得應用,降低了人工智能的開發門檻,平均節省研發成本80%以上。

華為決定創新,不走ChatGPT的正常路徑

無疑,大模型的發展将帶來一場科技革命,将徹底改變整個工業社會。華為作為一家企業,除了研究和工程化以外,更需要探索新的大模型商業模型,保證大模型的商業成功。

現在,華為将盤古大模型分為L0到L2的三層模式,并在完全解耦的基礎上,針對不同客戶的需求進行拆分組合,就是為了進一步探索大模型商業化的邊界。

華為,作為中國AI行業的領軍企業,已經邁出了大模型研究的重要一步。其盤古3.0的問世,雖晚于其他競争對手,但背後的研究積累和深厚的人才儲備,都讓華為在大模型的道路上走得更穩健。

華為早在2020年就預見了AI行業的兩個主要發展趨勢:一是小模型向大模型的轉變,二是AI與傳統科學計算的融合。是以,華為提出了六個子課題,其中包括高度與大模型相關的模型模高計劃和萬物預視計劃。盡管ChatGPT的推動力不容忽視,但華為在GPT-3釋出前就已經開始了大模型的研究。

華為的盤古大模型團隊擁有深厚的人才儲備,超過一半的團隊成員為博士學位持有者。這個年輕、技術過硬且敢于創新的團隊,是華為大模型研究的堅實後盾。

華為的未來發展方向,并非關注模型的參數大小,而是其在各行業的滲透率。除了已經進入的鐵路、煤礦、金融、政府等行業,還有更多的行業等待着華為的大模型的服務。

華為的優勢在于其全棧研發能力。在大模型的研究中,華為從算力到算子,再到架構、開發平台等都進行了自主創新,并沒有依賴開源技術。這一切都得益于華為在AI底座、算力和晶片等根技術上的深厚積累。

華為決定創新,不走ChatGPT的正常路徑

華為目前在AI發展上的主要着力點是:一方面打造強大的算力底座,做好産業基礎設施;另一方面從通用大模型到行業大模型,服務好各行各業。

華為的大模型盤古3.0釋出時,還公布了全新的LOGO,象征着盤古開天地,萬物新生的意義。這也預示着華為的大模型将在未來的發展中,肩負起重要的使命。

繼續閱讀