天天看點

“大模型至少有10年紅利期”!周鴻祎最新發聲

作者:中國基金報

中國基金報記者 尹振茂

在釋出智腦視覺大模型不到半個月後,三六零(601360)又在6月13日,釋出其智腦大模型4.0版本,其特點是多模态、全端應用、數字人。

在釋出會現場,三六零董事長周鴻祎認為,大模型至少有10年紅利期;對個人和企業來說,數字人是未來人工智能大模型最合适的入口。

在周鴻祎看來,大模型的安全問題超越了内容安全,應該訓練另一個GPT來監督GPT;未來如果隻講發展不講安全,該大模型會走不遠。據其透露,360已啟動了安全團隊在人工智能安全上的研究,首創了一個大模型安全風險的評估體系AISE,下一步将會公布。

6月13日上午,三六零股價大漲超9%,但午後逐漸回落,最終以5.49%的漲幅收盤,目前市值為1099億。

已趕上國際平均水準

大模型至少有10年紅利期

在釋出會現場,與會者普遍感覺到,周鴻祎明顯變瘦了。

對于國内大模型的發展水準,周鴻祎表示,“國内現在(AI大模型)你追我趕,不斷互相激勵,縮小和全球領先技術的距離。原來我說(差距)有一年半、兩年,我今天收回這句話。我認為國内現在這種發展疊代速度,已經基本趕上或者接近國際平均水準。”

對于如何做大模型,周鴻祎認為,現在不應該隻是拘泥于做很多通用的基礎能力,而應該想一想,如何把大模型做成真正像電一樣,能夠輸送到百行千業、千家萬戶、千千萬萬企業,輸送到億萬個辦公一族身邊,這樣才能産生工業級革命的力量。

“大模型就像發電場一樣,通過訓練大資料,直接産生了電力,可以把通用的人工智能能力直接輸送給每個行業和企業,把石油加工成電,這就産生了未來5-10年新的工業革命的機會。”

在周鴻祎看來,今天大模型的價值,不僅僅在于ChatGPT的使用量,以及一些網際網路場景的結合,更在于未來把大模型這種人工智能的能力垂直化、産業化、企業化、個人化,“這樣的産業機會剛剛開始,未來至少有10年的紅利期”。

據其介紹,谷歌釋出的大模型政策中,有四種大小尺寸不一樣的大模型。

Facebook釋出的以“LLaMA羊駝”為首的開源大模型裡面,有一種方式是把大模型越做越大,參數越大,訓練的語料越大。

但還有一種方式,是把大模型做小,即把它用在垂直領域,讓甚至可以安裝在一台電腦或者手機上。如果能裝在手機上,就意味着大模型将來可以部署在邊緣技術裝置,甚至部署在IoT裝置上。

是以,在“做大”的同時,大模型還有一個“做小”的方向。

“應該自己抽自己幾耳光”

在周鴻祎看來,大模型的難度已經不在于模型,模型有很多選擇,算法基本上都是公開的。

“今天的挑戰在于,用什麼樣的資料做預訓練,用什麼樣的題海戰術做有監督的微調。最後還有一個很重要的,就是這模型必須要在網際網路上找到使用者使用,因為使用者的使用他想到了各種例子,遠遠超越我們自己内部的測試。”

是以,周鴻祎認為,今天訓練大模型應該說不難,其壁壘在于資料、使用者标注、答題的标注,以及使用者的使用回報。

談到此處時,周鴻祎突然表示了深刻的檢討:

“當然說起來也很慚愧,講這一頁的時候,我覺得我們做搜尋的公司都應該自己抽自己幾耳光。”

實際上,搜尋公司都在發展大模型技術,無論是Bing、百度,還是谷歌。2018年,谷歌釋出了BERT算法,360當時就進行了跟蹤和使用,後來包括T5和GPT這幾個版本,360也進行了研究和跟進。

“我們确實缺乏OpenAI的這種精神,他們這些人對通用人工智能有一種執念,他們夢想把人類所有的知識訓到一個大模型裡面,而且堅定地走隻有解碼器的路線。

其他的公司雖然也都用大模型,我們就比較雞賊地用大模型解決很多現實的問題,比如廣告點選率高一點,推薦的内容好看一點,給你推薦的視訊讓你欲罷不能,大家都忙着做跟現實場景的結合。”

用GPT監督GPT

人工智能是一把雙刃劍,大模型本身也會有漏洞,會被人利用。

業内普遍認為,發展大模型的三大要素是算力、算法、資料,但周鴻祎認為應該改成算力、資料和訓練,而且還應加上“安全”。

“不管在哪一個國家做大模型和生成式AI,都要保證輸出的内容不能違背當地的法律法規,要符合當地的道德習俗。原來我認為這是Mission Impossible(不可能完成的任務),但在工程人員的研究下,我們找到了一個突破。怎麼保證GPT不說錯話?答案是訓練另外一個GPT來監督這個GPT。”周鴻祎表示。

在周鴻祎看來,大模型的安全問題超越了内容安全,還有更多内涵。

“大模型可以讓一個小白變成專家,也能讓一個很低水準的、原來當不了黑客的人,變成能寫攻擊代碼、釣魚郵件、研究系統漏洞的壞家夥,使得幹壞事的成本降低了很多。”

據其透露,360已經啟動了安全團隊在人工智能安全上的研究,首創了一個大模型安全風險的評估體系AISE,下一步将會公布。

而在6月10日的北京智源大會上,OpenAI聯合創始人、CEO薩姆·奧特曼(Sam Altman)當時在演講中表示,“AI安全是最新的技術,需要思考關鍵的AI安全問題,需要建構安全的分類器和檢測器,以監測符合使用者政策的情況,這一點很重要。”

薩姆·奧特曼當時稱,應該推動并引導與安全研究一緻的投資。他當時表示,正在投資幾個新的且有望能取得成果的方向,其中之一是可擴充的監督,嘗試使用AI系統來協助人類監督其他AI系統。

“未來如果隻講發展不講安全,這個大模型是走不遠的。我們把安全能力和大模型的研發結合起來,一方面用安全加強大模型的能力,另外一方面用安全使大模型更加可控。”周鴻祎強調。

對此,一位業内資深人士對記者表示,這個方向是對的,因為人工智能的能力一般人監管不過來,一定是以其人之道還治其人之身,訓練一個能夠監管人工智能的人工智能,或者用智能更高的人工智能監管智能水準低的人工智能,如用GPT5來監管GPT4。

大模型又迎釋出潮

聚焦應用産品大規模更新上線

2023年4月,中國移動研究院釋出了《大陸人工智能大模型發展動态》。報告顯示,國内大模型整體與GPT3.0性能相當,百度、騰訊、阿裡、華為等處于第一梯隊。

從大模型的布局體系來看,科技大廠在算力層、平台層、模型層、應用層進行了四位一體的全面布局。百度、阿裡、華為三家均從晶片到應用進行自主研發的全面布局,如百度的“昆侖芯+飛槳平台+文心大模型+行業應用”、阿裡的“含光800晶片+M6-OFA 底座+通義大模型+行業應用”、華為的“昇騰晶片+MindSpore 架構+盤古大模型+行業應用”。

從大模型參數量看,科技大廠的參數量遠大于科研院所。

2023年5月,科技部直屬的中國科技資訊研究所在中關村論壇釋出《中國人工智能大模型地圖研究報告》。

據該報告不完全統計,截至目前,參數在10億規模以上的大模型全國已釋出了79個。其中,科技大廠的大模型參數量較大:阿裡通義千問大模型參數在10萬億級以上、騰訊混元大模型和華為盤古大模型參數量均在萬億級以上、百度文心一言大模型參數量在2千億級以上、京東言犀大模型的參數量為千億級;垂直行業科技企業已經上線的參數量普遍在千億級以上;而科研院校大模型的參數量在千億級及以下。

民生證券研究院計算機團隊認為,在經曆二月至三月的大模型集中釋出期、四月至五月的産品研發期和政策方向逐漸明确後,六月起,人工智能大模型産品和應用有望迎來集中釋出。

但是,不同于二三月份的純粹大模型釋出,新一輪釋出潮,是基于大模型的應用産品開始大規模更新上線,為走進千家萬戶做準備。

從相關企業的情況來看,在科大訊飛、三六零之後,6月16日,華為人工智能架構生态峰會也将在上海召開,舉辦“上海昇思AI架構&大模型創新中心啟動暨夥伴入駐儀式”,以共建AI開源生态。

編輯:小茉

稽核:木魚