天天看點

“神仙打架,盤古來啦!”華為盤古大模型3.0正式釋出

作者:通信世界

“神仙打架,盤古來啦!”華為盤古大模型3.0正式釋出

大模型開始“卷”起來了。

去年年底,ChatGPT往喧嚣已久卻未有波瀾的AI“湖面”投擲了一枚“石頭”,僅用2個月時間就收獲了1億使用者。

當學生用其寫論文、程式員讓其輔助生成代碼,甚至作為小編的我都借助ChatGPT起标題時,AI大模型如綿綿細雨無聲地融入了我們的日常生活。

一石激起千層浪

“一石激起千層浪。”忽然間,國内的大模型如雨後春筍般興旺起來。當3月份辦公室還在“馬冬梅”般讨論着百度的大模型究竟是“文言一心”還是“文心一言”時,4月份阿裡巴巴的“通義千問”,5月份科大訊飛的“星火認知”、中國科學院的“紫東太初2.0”又席卷而來。

近日,在中國聯通官宣了“鴻湖”大模型後,中國電信也聲稱将要釋出 “TeleChat”大模型,中國移動的“九天”1+N大模型也在“蠢蠢欲動”。連營運商都開始進軍大模型了,難道說大模型賽道真的成為網際網路領域的“兵家必争之地”了嗎?

今日,華為也開始釋出了盤古大模型3.0。盡管業界大模型層出不窮,但從注冊“盤古”“PANGU”商标專利,到爆料又辟謠盤古大模型稱“盤谷Chat”,華為大模型的一舉一動仍是受到了業界的關注。

其實,華為從2020年就開始立項大模型研究,在2021年4月也就是前兩年的HDC大會上,華為就釋出了盤古NLP大模型1.0和盤古視覺大模型。當時,時任華為雲CEO的餘承東還給予了“華為雲盤古大模型是一款在AI産業界非常、非常、非常震撼的産品”重要事情說三遍的稱贊。

2021年的盤古NLP大模型,不僅是業内首個千億參數的中文大模型,而且在預訓練階段學習了超過40TB行業文本資料和400萬小時的行業語音資料,具有1100億參數。在大模型中,參數占有重要的分量。所謂的AI大模型就是将海量資料導入具有億量級參數的模型中,機器通過完成類似“完形填空”的任務後,最終被訓練成具有邏輯推理和分析能力的人工智能。目前大模型參數均在千萬億級别,GPT-3擁有1750億參數(即175B)。而後,在2021年5月,最大版本參數量達2000億的“鵬程·盤古”大模型也重磅亮相,2021年的盤古大模型着實稱得上“厚積薄發”。

同時,2021年的盤古視覺(CV)大模型也是一個超30億參數的CV大模型。在預訓練時就輸入了10億級圖像,能夠同時滿足底層圖像處理與高層語義的了解需求。

此後,華為又相繼推出了盤古科學計算大模型、用于藥物研發細分場景的大模型、盤古礦山大模型、盤古氣象大模型、盤古海浪大模型、盤古金融OCR大模型等。

就在華為正式釋出盤古大模型3.0的前一天,又一個重磅的新聞刷屏——華為雲盤古氣象大模型研究成果在《Nature》正刊發表。據了解,此模型是首個精度超過傳統數值預報方法的AI模型,速度相比傳統數值預報提速10000倍以上。這篇論文是近年來中國科技公司作為署名機關發表的《自然》正刊論文,《Nature》審稿人也對該成果給予高度評價。這一喜報又為盤古大模型3.0的釋出平添了一份期待。

千呼萬喚始出來

“千呼萬喚始出來”。今日,華為常務董事、華為雲CEO張平安正式釋出了華為盤古大模型3.0。面對大模型“神仙打架”的現狀,他談道:“自OpenAI釋出ChatGPT以來,各種大模型層出不窮,百家齊放。據不完全統計,全球已釋出數百個大模型,僅在中國就釋出了80多個。有些大模型會寫詩、會作畫。但華為盤古大模型不作詩、隻做事,因為它要深入到各行各業中去,賦能各行各業創造價值。”

華為對應基礎大模型、行業大模型和細分場景大模型分為L0、L1和L2層。據張平安介紹,盤古大模型3.0是一個面向行業的大模型系列,包括“5+N+X”三層架構,其中,“5”指的是L0層的自然語言、視覺、多模态、預測、科學計算這5個基礎大模型;“N”是指L1層的N個行業大模型,華為雲既可以提供使用行業公開資料訓練的行業通用大模型,包括政務,金融,制造,礦山,氣象等大模型。也可以基于行業客戶的自有資料,在盤古大模型的L0和L1層上,為客戶訓練自己的專有大模型;“X”則表示L2層為客戶提供了更多細化場景的模型,提供無限“X”的可能性,L2更加專注于政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、台風路徑預測等具體行業應用或特定業務場景,為客戶提供“開箱即用”的模型服務。

“神仙打架,盤古來啦!”華為盤古大模型3.0正式釋出

值得一提的是,盤古大模型采用完全的分層解耦設計,可以快速适配、快速滿足行業的多變需求。客戶既可以為自己的大模型加載獨立的資料集,也可以單獨更新基礎模型,也可以單獨更新能力集。在L0和L1大模型的基礎上,華為雲還為客戶提供了大模型行業開發套件,通過對客戶自有資料的二次訓練,客戶就可以擁有自己的專屬行業大模型。同時,根據客戶不同的資料安全與合規訴求,盤古大模型還提供了公用雲、大模型雲專區、混合雲多樣化的部署形态。

目前,盤古大模型已在金融、金融、制造、醫藥研發、煤礦、鐵路等諸多行業發揮着巨大價值。在政務領域,華為雲攜手深圳市福田區政務服務資料管理局,上線了基于盤古政務大模型的福田政務智慧助手小福,能夠精準了解群眾咨詢意圖,改變傳統的一網通辦模式,把老百姓的話語轉化為政府辦事的語言,讓城市更有愛;在煤礦領域,盤古礦山大模型已經在全國8個礦井規模使用,一個大模型可以覆寫煤礦的采、掘、機、運、通、洗選等業務流程下的1000多個細分場景,讓更多的煤礦勞工能夠在地面上作業,不僅能讓煤礦勞工的工作環境更加舒适,而且可以極大地減少安全事故;在藥物研發領域,原來一款新藥研發平均需要10年時間、花費10億美金。盤古藥物分子大模型助力西安交通大學第一附屬醫院劉冰教授團隊發現全球40年來首個新靶點、新類别的抗生素,并将先導藥物研發周期縮短至1個月、研發成本降低70%……

“盤古為行業而生,就要為行業着想,更好地服務千行百業的客戶。”張平安表示,盤古大模型要讓每個行業、每個企業、每個人都擁有自己的專家助手,讓工作更高效更輕松。我們始終堅持AI for Industries的戰略,在深耕行業的道路上不斷前行。我堅信大模型将重塑千行百業,而每一個開發者,都将是改變世界的英雄。

結語

中國的古代傳說中,盤古通過“開天辟地”讓混沌的宇宙煥發生機。希望,華為的盤古大模型也能在人工智能的潮流中帶給行業更智能化、更光明的未來,創造“新宇宙”!

END

作者:蓋貝貝責編/版式:甄清岚稽核:舒文瓊監制:劉啟誠

“神仙打架,盤古來啦!”華為盤古大模型3.0正式釋出

三連一下,一起過小暑

繼續閱讀