天天看點

不愧是華為!超前布局,憑借三大優勢成為又一關鍵性領域領頭羊

作者:好人長安君
不愧是華為!超前布局,憑借三大優勢成為又一關鍵性領域領頭羊

說起來,盡管華為遭受着令人難以想象的挫折,其核心業務海思晶片也幾乎被釜底抽薪,在晶片計算架構、EDA、晶圓代工等各個環節被重重封堵,以緻于這家在5G通信技術領域其技術水準最高的科技企業反而無法将5G應用于自家的産品,但是華為自身反而比誰都要樂觀。

這種樂觀不僅僅表現在任正非在各種場合對外釋放的信号,也表現在華為的産品服務能在制裁之下依然保持高水準,僅從被制裁這幾年的結果來看,華為不愧是被美國不計一切代價圍堵的科技企業,在如此高壓之下,華為居然頑強地生存了下來,非但其營收規模、研發投入等基本沒有削減,在困境中甚至實作了正增長。

更讓國人熱血沸騰的是,在攸關下一代技術革命的人工智能領域,華為在不知不覺間也已經走在了國際前列,并且這一次展現出的實力,已經突破了美國的制裁與限制,真正實作了自主可控。

為什麼這麼說呢?

這就不得不提華為在人工智能領域的三大優勢。

不愧是華為!超前布局,憑借三大優勢成為又一關鍵性領域領頭羊

第一個優勢:人工智能晶片布局

早在華為尚未被美國制裁時,華為就已經在手機業務上應用了自己的人工智能晶片,而且是全球首款內建了人工智能晶片的智能手機,這也成為華為海思被重點“照顧”的主要原因之一。

後來美國啟動了對華為晶片業務的極限制裁,從EDA軟體(晶片設計工具)、基礎硬體架構(晶片設計架構),再到晶片代工(晶片的量産),幾乎在每一個環節設定屏障,也對華為海思麒麟、鲲鵬、昇騰、巴龍、天罡、淩霄六大系列晶片的研發制造造成巨大影響。

但制裁并沒有打消華為海思在晶片端的繼續研發,也沒能阻擋住華為的高歌猛進,這一切源自于華為在晶片領域的高瞻遠矚——早在很多年前,華為為了規避未來在新興領域大機率會發生的制裁行為,在人工智能領域發起了在三大要素方面的基礎性技術的攻關。

在算力領域的成果,就是當今鼎鼎大名的昇騰AI晶片。昇騰在國際上對标的主要是英偉達的GPU,國内對标的包括寒武紀等廠商生産的系列AI晶片産品,近兩年來,在國内人工智能硬體建設領域,昇騰的市占率更是飛速上漲,在AI訓練領域獨一無二。

昇騰晶片主要有兩款,即面向訓練的昇騰910和面向推理的昇騰310,後者早在2018年就被內建在麒麟晶片中,前者在近兩年尤其是今年以來異常火爆。

華為在人工智能晶片領域的優勢不僅僅在于推出晶片産品,更重要的是建立起了完全自主可控的一個人工智能晶片生态:它為AI晶片建立了達芬奇架構,同時為開發者建立了大量的開發工具和軟體,用以支撐開發者對AI晶片形形色色的需求。這個特點讓昇騰晶片和以之為核心的昇騰伺服器在人工智能領域獲得了越來越多的關注與應用。

時至今日,在美國禁止英偉達高端GPU産品出口至中國的禁令下,國産替代已經成為必然要走的路,而人工智能領域也是中美科技的下一輪“競争熱點”,在這個背景下,昇騰的發展已經不僅僅是商業上的“攻城略地”,而很可能将成為中國科技産品進一步外輸的重要轉折點。

不愧是華為!超前布局,憑借三大優勢成為又一關鍵性領域領頭羊

第二個優勢:工業領域大模型的布局

前不久,人民日報在一篇報道中不經意間提到了華為的盤古系列大模型,根據文中内容,盤古系列大模型應用于某先導制藥機構研發新藥的過程,将研發新藥的時間縮短了70%,成本降低了30%。

華為盤古系列大模型包含NLP大模型、CV大模型、多模态大模型、科學計算大模型等,其中NLP大模型對應内容生産和内容了解;CV大模型為分類、分割和檢測;多模态大模型具備跨模态檢索、跨模态生成、看圖說話四種能力;科學計算大模型則分為分子大模型、金融大模型和氣象大模型。此次人民日報提及的應該是盤古系列大模型中的科學計算大模型,而據華為雲官網顯示,上述4個大模型均“即将上線”。

值得一提的是,備受關注的百度文心一言是基于多模态大模型,百度也是目前國内唯一一個開啟大模型應用内測的科技企業。華為相比百度顯然要低調很多,但其在工業等行業的應用早已經開始推動。

可以這麼說,如果說在多模态大模型領域,百度有可能領先于華為,那麼在其他領域,尤其是工業化應用,以及基礎布局方面,華為已經遠遠走在了國内科技企業的前邊,甚至在某些領域比美國那些同行更為領先。

這種領先不僅僅是建立在華為自有的昇騰伺服器所提供的算力上,更根本的領先在于算法。

華為與OpenAI在大模型研發的出發點上有一個本質差別:前者主要服務于工業領域、商業領域的特定對象,而後者則服務于通用型對象。這個差別決定着兩者在算法上的傾向性有着本質不同:前者會更傾向于對特定對象做優化,優化方向更為精準,更講究“精确的正确”;而後者由于服務對象非特定,在參數設定上務必會傾向于“模糊的正确”。

這種本質的差別會造成兩者在參數數量級上的巨大差别,通用型需要更龐大的參數來應對五花八門更多類型的需求,而特定對象類的大模型因為服務對象很精确,會減少很多非必要性的工作。

用大白話來說,通用型大模型就像一個百貨商店,而特定對象型大模型則更像是品類店,比如五金店、鞋店、服裝店等提供專門産品服務的店鋪。

華為盤古大模型的強悍在于,它在特定對象大模型的參數設定上也來到了千億級,用上邊的比喻來說,就是把一個五金店開的跟一個大百貨商店一樣大——那麼可想而知它能夠給人們提供的産品服務會豐富到一個什麼等級。

并且華為不僅僅是在多模态這一個類别的大模型領域跟百度、OpenAI同場競争,它是在多個領域布局,其大模型所采用的架構也來自自研的Encoder-Decoder架構。

換句話說,在人工智能軟體領域,華為同樣建立了一個“生态”,并且布局的深度和廣度超出了絕大多數人的想象,而且很明顯比美國的同行們在特定對象場景下的大模型應用有着更深的底蘊。

不愧是華為!超前布局,憑借三大優勢成為又一關鍵性領域領頭羊

孟晚舟歸國

第三個優勢:市場聲望

可能有些人會覺得這個優勢似乎跟華為人工智能的崛起沒有直接關聯,其實是有的。

對華為來說,人工智能三要素中它并不擔心算力、算法對它的限制,反而是資料,對一個制造型科技企業而言是天然的短闆。

為什麼ChatGPT會誕生于網際網路公司?為什麼百度、騰訊、阿裡這些會在大模型上進展迅速?其根本原因在,它們具備三要素中算法和資料的優勢,尤其是資料,而算力則可以用錢砸出來——在不被制裁的情況下。網際網路平台型企業天然就擁有大量的資料,這些資料也是它們最大的财富所在。

華為如果要在人工智能領域有所建樹,就必須要解決資料問題。有人可能會說,花錢可以買資料,這不失為一種解決思路,但這種解決思路對華為來說效率太低。

大模型的訓練所使用的資料不僅僅有“數量級龐大”這一個要求,還有就是要“豐富”和“優質”。這兩個要求其實就是對資料的真實性、多樣性和有效性提出了很高的要求,但這個要求對資料商提供的資料包而言是很難量化的,換句話說就是資料商或者平台就算把一個“看起來合乎标準但實際上沒那麼有用”的資料包交給華為,它也很難分辨,隻能被動接受“跑跑看”,但AI訓練的成本相當高昂,訓練完一次可能就需要數千萬元。

華為怎麼解決資料問題的呢?在我看來就是利用它的市場聲望,在特定領域獲得優質的資料供應。

比如說人民日報提到的制藥機構,華為利用自己的市場聲望,在醫藥領域獲得了大量的資料支援,進而能夠完成科學計算大模型的成型,同時反哺醫藥領域。

這種巨大的市場聲望讓華為能夠更快速地解決資料可信度的問題,同時通過技術反哺,與相關的行業建立更長久的“互利關系”,進而實作行業資料源源不斷的供應,為盤古相關大模型的疊代提供“養料”。

不愧是華為!超前布局,憑借三大優勢成為又一關鍵性領域領頭羊

寫在最後

除了優勢,我們也應該正視不足之處。

首先在意識上,我們應該明确一點——隻有一個華為是不夠的。同時我們也不應該将所有高端科技的突破,尤其是晶片、電子資訊乃至于人工智能領域的技術突破希望,寄托于華為一家民營企業身上,因為中國需要的是整體層面的科技飛躍,而能夠支撐這種科技飛躍的,也絕無可能僅依靠一家企業來完成,它必然是多點開花、蔚然大觀的現象。

其次對華為和國内人工智能相關企業而言,算法和資料可能也并不是最重要的,我們在很長一段時間裡,其主要精力依然應該放在晶片制造的核心技術攻關上去,不要再寄希望于半導體國際供應鍊的恢複,而是要下定決心造出能支撐先進制程的光刻機。

最後想說,。我相信即便OpenAI們有先發優勢,我們在補足短闆後,依然有很大機率能“後發而先至”,那時候就真的隻是時間問題。

希望這一天早點到來。