天天看點

華為的大模型終于來了!我的評價是:相當震撼

作者:速說影視一二三

在華為開發者大會 2023 上,華為不僅僅展示了盤古大模型 3.0 的強大能力,還揭開了一系列令人矚目的成果。這次釋出會的精彩紛呈,讓人目不暇接。然而,其中最引人矚目的焦點,無疑是盤古大模型 3.0 在氣象預測領域的革命性突破。

盤古大模型的革命性之處在于它在氣象預測中的應用。以前的氣象預測主要依賴于基于2D神經網絡的模型,但氣象系統的複雜性使得這種方法的效果受到限制。更糟糕的是,以往的AI模型在預測過程中會積累誤差,這會影響結果的準确性,是以一直未能得到廣泛應用。然而,盤古大模型通過采用3DEST的三維神經網絡來處理氣象資料,徹底改變了這一局面。

華為的大模型終于來了!我的評價是:相當震撼

3DEST網絡訓練和推理政策采用了階層化時域聚合政策,從根本上減少了疊代誤差,提高了氣象預測的精度。舉個例子,傳統的AI氣象預測模型在預測台風來臨時,通常提前6小時進行預測,然後在這6小時内多次計算台風到達的時間。這種方法可能導緻不同的計算結果,誤差積累,影響了預測的準确性。而盤古大模型通過訓練4個不同預報間隔的模型,分别是1小時、3小時、6小時和24小時疊代1次,根據需要選擇合适的模型進行疊代。這種政策有效地減小了誤差,使得天氣預報邁向了一個新的水準。

華為的大模型終于來了!我的評價是:相當震撼

盤古大模型之是以如此出色,還得歸功于其獨特的架構。華為盤古大模型3.0采用了5+N+X的三層架構,使其能夠快速應用于各個行業。這一架構巧妙地解決了AI落地行業時所面臨的資料擷取難題。首先,盤古的第一層L0包含了5個基礎大模型,它們學習了海量的百科知識、文學作品、程式代碼等文本資料,以及數十億張帶文本标簽的網際網路圖像,為模型建立了基本認知。然後,在第二層L1中的模型讓L0中的某一個基礎大模型學習了N個相關行業的資料,類似于大學的大學階段,需要選擇不同的專業進行學習。最後的L2則進一步細化到某個具體的場景,類似于研究所學生階段,根據不同行業的需求定制模型。

華為的大模型終于來了!我的評價是:相當震撼

華為還加入了一個回報環節,根據他們的說法,過去開發一個GPT-3規模的行業大模型通常需要5個月,但有了這套架構,開發周期能縮短至原來的1/5。這也使得許多行業資料集較小的限制得以解決,為各行各業帶來了更多可能性。

不僅如此,華為還提出了算力國産化的概念,解決了AI算力方面的短闆。他們的昇騰910處理器在性能上已經超越了英偉達A100,雖然實際應用中還存在差距,但這一舉措表明了華為在AI領域的決心。而與此同時,華為還提供了全套的應用套餐,使使用者能夠更高效地訓練大模型。

華為的大模型終于來了!我的評價是:相當震撼

綜合來看,華為在AI領域的布局是深刻而令人印象深刻的。他們不僅關注AI的基礎研究,還積極探索如何将AI落地應用于不同的行業。華為的盤古大模型3.0和算力國産化計劃,為AI行業帶來了新的活力,也讓人看到了AI領域未來的巨大潛力。如華為創始人任正非所言,AI領域的真正時代還在後頭,我們有理由期待更多創新和突破的出現。

華為的大模型終于來了!我的評價是:相當震撼