天天看點

華為雲盤古大模型3.0來了!它為何不做中國版ChatGPT? | AI之聲

作者:第一财經

今年以來,以預訓練大模型等為代表的新興技術正在掀起新一輪人工智能熱潮,百“模”共生,百家争鳴下,大模型的真正用處卻依舊朦胧。

在經曆半年多的“狂飙”後,即便是曾經爆火的ChatGPT流量也不再繼續。當C端熱度逐漸褪去,産業界的噪音開始多了起來:僅憑聊天作畫等功能,大模型就可以重構人類社會?人工智能的下一步該如何發展?

“盤古大模型不作詩,隻做事。”7月7日下午,華為常務董事、華為雲CEO張平安在華為開發者大會2023上再次明确了華為在大模型領域的定位,不做“ChatGPT”類産品。他表示,盤古大模型3.0是一個完全面向行業提供服務,以行業需求為基礎設計的大模型體系。

在華為雲看來,人工智能已經成為目前衆多科技企業的戰略競争焦點,在與實體經濟的結合中,行業大模型扮演着重要作用,這将帶來更大的産業機會。

不做“ChatGPT”

自2022年12月ChatGPT問世以來,AI大模型加速了新一代人工智能的發展。當大模型和生成式AI的技術不斷取得突破,衆多行業人士紛紛開始思考大模型技術在商業化營運中,将會産生何種效用。

在上述開發者大會中,華為認為,大模型正在引領新一輪人機革命,為使用者帶來颠覆式使用體驗。如果說在PC時代,“滑鼠+圖形使用者界面”開啟了第一次互動革命;“觸屏+手勢”開啟了移動互聯時代,而“對話+5G”則開啟了智能互聯時代,标志就是以ChatGPT為代表的大模型技術。

華為雲盤古大模型3.0來了!它為何不做中國版ChatGPT? | AI之聲

2015年12月,矽谷的企業家們開啟了OpenAI的引擎,ChatGPT計劃也在這個時候開始醞釀。而在前一年,谷歌已經收購了DeepMind,并且依靠DeepMind團隊研發的AlphaGo在全球掀起了一場AI風暴。

随後,谷歌在2017年釋出了Transformer大模型,成為了AI大模型的新分水嶺。但令谷歌沒有想到的是,Transformer随後卻成為了OpenAI滋養ChatGPT的土壤。

OpenAI火爆之後,也激發了科技巨頭對大模型的軍備競賽。今年3月,百度釋出了文心一言,并開始将其融入百度的所有業務;4月,阿裡釋出了通義千問,并于6月将大模型的布局拓展至AI音視訊賽道。據不完全統計,目前僅國内已釋出超過80個大模型産品,對應不同行業、不同應用場景,“百模大戰”發展如火如荼。

但在大模型領域走得越久,華為對大模型賽道的态度卻越來越謹慎。“在華為看來,面對目前形勢,既要樂觀,又要保持冷靜。”華為輪值董事長胡厚崑在6日舉行的第六屆世界人工智能大會上表示,人工智能的發展,關鍵是要腳踏實地,推動人工智能走深向實,真正為千行百業服務。

從華為在大模型領域的布局來看,立項于2020年,并于2021年4月釋出“盤古大模型”,摸索中,華為逐漸确立在這領域的新定位。

從7号釋出的内容來看,盤古行業大模型3.0更新後,盤古将是其“大模型系列”的統稱,既包括了語言大模型、視覺大模型在内的基礎模型,也包括了具有行業的屬性的金融,制造,藥物分子的行業模型以及場景開發類别的模型服務。第一财經記者從華為内部了解到,前期,華為雲AI已經在各行業有超過1000個項目,這也為盤古大模型在行業中的落地起到了鋪墊作用。

華為創始人任正非曾指出,未來在AI大模型方面會風起雲湧,不隻是微軟一家。人工智能軟體平台公司對人類社會的直接貢獻可能不到2%,98%都是對工業社會、農業社會的促進。

在任正非看來,模型的應用有時比模型本身還有前途,華為會做AI的底層算力平台,但應用平台不是華為的選項,“在2%的平台貢獻裡,我們占一點點就行。ChatGPT對我們的機會是什麼?它會把計算撐大,把管道流量撐大,這樣我們的産品就有市場需求。”

大模型如何從概念走向落地?

在從目前全球市場的競争格局來看,3000多個可用的生成式AI應用,全球數千家科技公司參與。大模型的一路“狂飙”下,企業需更加明确應用落地的方向才有可能在這場硬仗中突圍。

張平安表示,“目前大模型大多數應用都集中在2C領域,在面向行業應用時,由于行業資料擷取難,技術與行業know-how結合難,大模型在行業的落地進展較慢。”

而華為選擇的突破口一個是放大來自于人工智能晶片的算力優勢,另一個則是在多個場景中進行大模型的深耕。

華為昇騰計算業務總裁張迪煊7月6日接受記者采訪時表示,華為目前已經幫助孵化了20多個基礎大模型,比如科大訊飛的星火大模型,“中國大模型中約一半由昇騰AI支撐”。

2019年8月,華為宣布自研的AI訓練晶片昇騰910商用,7nm制程,稱同等功耗下算力是英偉達V100晶片(英偉達A100上一代産品)的兩倍。根據華為此前公開的資訊,每個叢集需要1000張昇騰910。在被制裁的情況下,目前華為把昇騰計算叢集的規模從最多4000張卡提升到了1.6萬張卡。

這意味着華為成為英偉達之外的“另一個選擇”,為其他行業企業提供大模型的算力并帶動自身産品出貨,形成商業正循環。而在盤古大模型3.0的官方介紹中,該模型已經可以客戶提供100億參數、380億參數、710參數和1000億參數的系列化基礎大模型訓練。

此外,張平安在演講中提到了盤古的“5+N+X”三層架構。

L0層包括自然語言、視覺、多模态、預測、科學計算五個基礎大模型,提供滿足行業場景中的多種技能需求,L1層是N個行業大模型,華為雲既可以提供使用行業公開資料訓練的行業通用大模型,包括政務,金融,制造,礦山,氣象等大模型。

L2層為客戶提供了更多細化場景的模型,更加專注于政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、台風路徑預測等具體行業應用或特定業務場景,為客戶提供“開箱即用”的模型服務。

換句話,華為的大模型不僅僅面向于對零基礎的行業客戶,也包括了本身做大模型應用的企業。

張平安表示,盤古大模型已覆寫金融、金融、制造、醫藥研發、煤礦、鐵路等諸多行業。“比如,在藥物研發領域,原來一款新藥研發平均需要10年時間、花費10億美金。盤古藥物分子大模型助力西安交通大學第一附屬醫院劉冰教授團隊發現全球40年來首個新靶點、新類别的抗生素,并将先導藥物研發周期縮短至1個月、研發成本降低70%。”

值得注意的是,除了華為雲,目前騰訊、阿裡、位元組、360等科技企業也看到了行業端的機會,并瞄向行業大模型進行布局。

“對話、寫詩、作畫絕不是大模型的全部。我們需要去深入思考大模型的應用方向。”中國工程院院士邬賀铨認為,要将大模型切實投入到城市發展、金融科技、生物醫藥、工業制造、科學研究等領域,也需要專業的企業群組織加速其在實體産業落地,為産業剛需帶來實實在在的大價值,真正意義上大規模服務社會。

繼續閱讀