天天看點

「詳細」原華為工程師用平民化語言講AI大模型,讀這一篇足矣

作者:甄品空間

2023年初,以ChatGPT出圈為标志,AI大模型的消息撲面而來,出現在各大新聞、論壇、文章中。人們對此的反應,有欣喜,有擔憂,也有觀望的。本文不聊技術,也盡量少提專業詞彙(但為了和業界文章的銜接,也會解釋必要的專業詞彙)。而是以平民化的方式向你介紹大模型是什麼、大模型可能發展的趨勢以及怎麼擁抱大模型。文中可能出現“大模型”或“AI大模型”等都指一個東西。

【閱讀對象建議】本文的閱讀對象是科技界職業者、絕大部分其他職場人員及商業人士。其他普通讀者可不用看,隻管靜等他的出現。因為後期基于大模型開發的應用或産品,其形态與當下沒有多大差別。如:普通應用也是PC或手機中呈現的APP;實物産品也是智能音箱、人形機器人等。這些産品背後有沒有大模型支撐不用關注,可能隻發現體驗更好、反應更快、互動更自然了。就像我們現在能感覺到的變化。拿語音輸入舉例,多年前我們念一段話,可能機器會輸出啼笑皆非的文字,但現在拿起手機使用語音輸入法輸出的文字很準确,很自然!因為輸入法背後疊加了AI(人工智能)的原因。

還有,文末有彩蛋!

一、什麼是大模型、AIGC、ChatGPT、AGI

首先我們再闡述下這幾個經常出現的名詞解釋,以便對齊。

(1)什麼是大模型?

首先我們來了解什麼是大模型?先搬磚學術界的解釋:大的語言模型(Large Language Model LLM)的簡稱。為什麼是語言模型?用程式設計指令也可以使用AI,但太不友善。因為人們發明人工智能的目的還是應用。而幾千年來帝王使喚官員,官員使喚小吏,老爺使喚丫頭等都喜歡“使喚”,“使喚”的方式就是自然語言。現總經理與助理交流也大多用“語言”。是以自然語言是人們應用AI最便捷的方式。要用自然語言就是研究語言模型。

語言模型(Language Model, LM)最早用于語音識别(speech recognition),解決鍵盤輸入文字的問題。輸入一段音頻資料,語音識别系統會生成多個句子作為候選,究竟哪個句子更合理?就需要用到語言模型對候選句子進行排序、預測,最大限度地接近語音原意。前提到到過,因為以前模型小,機器算力低,輸出來啼笑皆非的文字。現在的大模型就能解決這個問題了。

這裡的“大”指模型的參數數量大。參數是指大模型中神經網絡中的權重和偏置量的多少,即可以調節的開關有多少。通常指超過百萬甚至十億參數以上的語言模型。現在最大的大模型參數已達萬億。為什麼參數數量會有這麼大。

首先世界本身複雜,人類的語言複雜。人類語言詞彙多,文法複雜,還要适應不通語感環境,不複雜都不行。另外,還要解決的數學問題也複雜。

其次大模型處理問題的底層技術是:統計學、機率學。自然參數越多就能更好地了解人類語言、認識世界,向人類輸出想要的且有價值的内容。沒有大量的參數配置就得不到理想的效果。

那有哪些大模型平台呢?

簡單浏覽下,到現在國内大模型如雨後春筍般冒出了數百家,下圖是截止5月的一個不完全統計名錄。但并不是說這些大模型是今年趁熱啟動今年釋出的。大多有實力的廠商已經布局多年,比如:華為盤古大模型從2020年開始立項,在2021年4月釋出了第一版本,今年釋出的是3.0版本。

「詳細」原華為工程師用平民化語言講AI大模型,讀這一篇足矣

表1

(2)什麼是AIGC

AIGC(Artificial Intelligence Generated Content)即生成式人工智能。AIGC是為了模拟人類寫作、畫畫、看圖說話、譜曲等輸出式創意需求而生。而這些能力必須要依賴大模型才能實作。是以,可以說AIGC是基于大模型的一個應用領域。

(1)什麼是ChatGPT

ChatGPT全稱是Chat Generative Pre-trained Transformer。是OpenAI 公司開發的一個基于 Transformer 模型預訓練語言模型的聊天軟體。他的主要功能是學習人類的大量資訊,包括語言、文學、曆史、數學等知識(就好像人類讀書求學),然後在此基礎上根據人們需求生成結果。是通過提問/提示語(Prompt)向ChatGPT提要求,然後從學習的内容中通過搜尋、推理輸出文本、圖畫結果。可看出,ChatGPT是AIGC領域的一個軟體。其他類似的還有百度的文心一言、阿裡的通義千問等。我們看上表,有的“廠商大模型及産品”一欄中有一個“/”,其前面就是大模型産品,後邊是聊天式AIGC産品。如:百度大模型産品“文心”,類似的AIGC聊天産品是文心一言。而華為大模型産品是“盤古”大模型,沒有釋出聊天式AIGC産品。

(2)什麼是AGI

AGI(Artificial General Intelligence)就是通用人工智能的意思。前幾年使用的AI不是通用的,稱為專用人工智能。如:通過視訊識别煙火的AI,能抓取生産線上零件的機器臂中的AI等。這些相對來也可形象地說是“小模型”,這些AI是聽不懂“床前明月光”的。正因為現在有了大模型,就有了聽懂人類語言的能力,是以為通用AI創造了條件。下文會更形象和詳細地對二者作差別介紹。

二、為什麼大模型是AI發展道路上劃時代的裡程碑

1.機器可快速學習大量知識

以前是小模型AI,可類比為進城務工的産業勞工,因為多種原因沒念多少書。經過工廠工頭的專項教育訓練,就可以上生産線的工作了。如果要換崗,再經過上崗教育訓練。小模型AI也類似:識别生産線上抓取零件的機器臂就類似這樣的産業勞工,在開始前需要對機器臂中的系統注入AI能力,這些AI需要根據産線要求作資料訓練:零件有什麼形狀,線邊倉什麼形狀,零件如果有瑕疵又抓到什麼地方等等,這樣訓練後的機器臂才能上線使用。如果要抓取别的物料,則又要别的物料資料訓練。這就非常類似于産業勞工的崗前教育訓練。

「詳細」原華為工程師用平民化語言講AI大模型,讀這一篇足矣

圖1 産線上的機器臂

「詳細」原華為工程師用平民化語言講AI大模型,讀這一篇足矣

圖2 勞工崗前教育訓練

現在的AI大模型,可類比為念了多年書的大學生,已經學習了文、史、地、數、理、化以及管理類等通識知識和專業知識。他進工廠可能的崗位就是項目經理、産品經理。而且你讓他寫個什麼會議紀要、什麼周報都是小兒科。如果要換崗作總經理助理,他自己學會相關知識後就可上崗了。AI大模型就類似于這樣的大學生。如華為的盤古模型也好、百度的文心模型也好,已經學習了能聽懂人類的語言,學習了無數本書,無數的專業文章,學習了數理化,也學習了怎麼學習。一個大模型我們初拿來随便讓他寫個作文,寫個會議紀要都不是問題。如果讓他作個法務工作,則可以把相關的法律資料喂給他學習,學了之後就可以作為你的法務助理,回答一些法律問題,幫你評審合同,幫你寫訴狀等(樣例見圖3)。你讓他換崗做新藥配方,則可以把醫藥資料喂給他學習,他學習完後可以将為你作新藥配方試驗,省去很多實際試驗環節,加快新藥開發速度(樣例見圖4)。

「詳細」原華為工程師用平民化語言講AI大模型,讀這一篇足矣

圖3:團竹科技協助某法律團隊在盤古平台初步測試的法律大模型應用

圖3:團竹科技協助某法律團隊在盤古平台初步測試的法律大模型應用

「詳細」原華為工程師用平民化語言講AI大模型,讀這一篇足矣

圖4:華為盤古大模型用于新藥研制的應用案例

圖4:華為盤古大模型用于新藥研制的應用案例

下面談關鍵點:

(1)大模型學習速度快:我們人類學習需要“十年寒窗”,但AI大模型不需要,隻要算力夠,這個學習訓練可能就幾月甚至幾天。如:據說ChatGPT從3.5版的1750億參數到4.0版本的萬億參數僅訓練了1個月。而4.0版本的功能公認的好太多。

(2)大模型跨行容易:如上文的案例,一個大模型從法律轉向醫藥隻是投喂資料的差別,而普通法律專業大學生讓他轉醫藥開發基本不可能,就是能轉也得花長時間學習和訓練。

2.大模型吹響了工業4.0的号角

「詳細」原華為工程師用平民化語言講AI大模型,讀這一篇足矣

圖5:工業的四次革命,圖檔來自網際網路

人類工作發展從18世紀開始的第一次工業革命到已經曆過三次工業革命,現在開進入第四次工業革命(另一種說法是從工業從1.0到4.0)。

第一次工業革命是蒸汽時代,機械代替繁重類人力勞動。

第二次工業革命是電氣時代,電力驅動大規模生産線出現,生産效率大幅提升

第三次工業革命是自動化時代,以數控車床為代表,工業機器人代替輕便類人力勞動。

第四次工業革命智能化時代。以AI、物聯網技術為代表,機器将可為人類作輔助決策。特别得益于AGI(通用人工智能),AGI讓機器能聽懂人的自然語言,輸出人類便于識别的文字和語音以及圖像、視訊等。這一代與前幾次最大差別是:前幾代是對人類體力勞動替代,而這一代是腦力勞動的替代。機器具有思考、推理等智慧化能力,這是劃時代的象征。是以說AGI吹響了這次革命的号角。

3.AI大模型是智能時代的OS(作業系統)

以前的台式電腦/PC時代作業系統代表是 Windows系統;移動/手機時代的作業系統代表是 IOS 和android,以及在開源架構基礎上開發的鴻蒙系統。而當下智能時代的作業系統即是大模型平台。大模型平台為應用賦予了記憶、了解、推理、生成等能力,這也是為什麼有實力的大廠都在研發大模型的底層原因。他們大多會以MAAS(模型即服務)的方式向客戶或生态夥伴提供服務。也可以提供開源大模型供客戶私用化部署。

将來基于大模型平台開發的app應用将如現在的IOS、安卓應用一樣,鋪天蓋地在各行各業各領域出現。甚至一個政府的部門、一個企業或一個律所等單個組織或營運實體,都會開發基于自己私有資料訓練的大模型應用。

三、大模型發展趨勢預判

今年初,以ChatGPT3.5版本釋出為标志,大模型成了今年科技界的熱詞。今年業界說是AI大模型元年。既然大模型是從國外産品熱度開始,那我們就以國内使用者使用國内國外産品的次元作個趨勢的簡單預判。

1.總體看國内國外大模型産品此起彼伏,東西方各亮半邊天,各具特色。競争到最後,集中化程度會越來越高,最終形成“721”格局。即:頭部産品占據70%的市場佔有率,腰部産品占據20%的市場佔有率,其他産品占剩下的10%的市場佔有率。

2.對國外大模型産品,國内使用者群主要是ToC方面,ToB可能有小部分使用者。主要是當今格局/“信創”原因。ToC使用者從低向高使用大概可分三層:

第一層是普通使用者,直接使用ChatGPT或Midjourney(一個國外文生圖的軟體),通過Prompt提問讓軟體輸出結果。包括個人和機關中有需求的人員自己用用,提升工作效率和輔助自己創意的工作。

第二層是中階使用者,通過大模型軟體的接口(如:ChatGPT API接口) 建立自己的應用,可以自用,也可以營運變現。如:有的直接用接口做“套殼”應用,加個界面和使用者權限管理。因為ChatGPT軟體在國内不能直接通路,且注冊需要不小的技術門檻。這樣懂“科學”上網和這套注冊流程的使用者就做個應用,讓國内使用者付費直接通路。還有的根據某細分場景需求,如:文章要點提煉、新聞彙聚、論文查重等需求做垂直應用。

第三種是高階使用者,國外有的大模型開源了,于是這些使用者把大模型代碼下載下傳下來,在雲算力池或自己AI伺服器搭建私有化大模型平台。這其中需要解決環境搭建、語言适配、性能調優、穩定運維等一系列問題才能讓大模型跑起來。技術難度比較高。

2. 對國内大模型産品,ToC和ToB客戶群都比較熱鬧。

ToC使用者群可能更集中使用個位數的大模型平台。百度文心一言、阿裡通義千問、騰訊混元、位元組火山、科大訊飛可能為排頭兵。

TOB方面:閉源大模型的比較有實力的是華為盤古、百度文心、科大訊飛(語音為主)。開源的大模型會按行業特色百花齊放,個人感覺後期有可能華為盤古會開源,不是直接把包含萬億參數的閉源産品開源。而是按行業開源100億左右參數的行業大模型模型。這是華為對大模型的定位确定的,因為華為短期不靠大模型賺錢,而是建立生态,積累品牌價值,拉動其他産品/平台的百花齊放(包括昇騰GPU顯示卡、作業系統等)。開源模型的好處是滿足客戶:模型持續訓練和資料不出内網的訴求。

四、大模型的正确應用姿勢

對個人來講:

(1)積極擁抱大模型,應用大模型為自己服務,為自己工作

對個人來說,大模型就是為我所用的工具,與直尺和電腦一樣,和Word及電商平台一樣。充分應用AI為自己工作和生活服務。比如:

A.應用AGIC為自己生成可用的文案、PPT、圖檔、音樂等内容。提升工作效率和更多創意工作。現在已有很多人在應用ChatGPT、文心一言等工具于工作中。甚至可以通過自己照片、視訊生成自己的數字虛拟人來作短視訊,甚至直播帶貨。還有為全媒體做營運的小團隊或工作室,通過此類軟體挖到第一桶金了。這是目前使用大模型最多的場景。

B.審視自己的工作崗位是否會被替代,積極學習提升,跨越這個過渡期。

就像以前汽車的出現替代了馬車。這對于馬車夫來說是一個沉重的打擊,大量馬車夫在短期内将會面臨失業。但是也有馬車夫通過學習和轉型來适應社會的發展變化,尋找新的就業機會。比如:馬車夫從事汽車司機、汽車維修等相近崗位,也有的馬車夫學習其他行業技能,進了工廠擰镙絲等。隻要盡早評估,盡早準備,通過一段時間過渡,能在社會變革中找到新的發展機遇。

「詳細」原華為工程師用平民化語言講AI大模型,讀這一篇足矣

圖6:汽車與馬車

那當下的哪些崗位容易被AI大模型替代呢?以下舉一些例子:

(1) 生産線勞工:生産線勞工通常執行重複性的任務,例如裝配、檢查和包裝。這些任務可以通過自動化和機器人技術來實作。

(2) 客服代表:客服代表通常執行重複性的問題解答和任務處理。這些任務可以通過自然語言處理和語音識别技術來實作。

(3) 資料輸入員:資料輸入員通常執行重複性的資料輸入和處理任務。這些任務可以通過自動化和機器學習技術來實作。

(4) 司機:随着自動駕駛技術的發展,司機這個職業可能會受到影響。自動駕駛技術已經在一些領域得到應用,如計程車、卡車和公共汽車等。未來随着技術的不斷進步,司機這個職業可能會逐漸減少。

(5) 倉庫勞工:倉庫勞工通常執行重複性的任務,例如裝卸貨物和整理庫存。這些任務可以通過自動化和機器人技術來實作。

(6) 某些金融崗位:金融領域的某些崗位,如信貸審批員和保險理賠員,需要處理大量的資料和文檔。這些任務可以通過自然語言處理和機器學習技術來實作。

(7) 某些醫療崗位:醫療領域的某些崗位,如放射科醫生和病理學家,需要處理大量的醫療圖像和資料。這些任務可以通過計算機視覺和深度學習技術來實作。

(8) 某些銷售崗位:銷售領域的某些崗位,如零售銷售員和電話推銷員,需要處理大量的客戶咨詢和銷售任務。這些任務可以通過自然語言處理和機器學習技術來實作。

(9) 某些市場營銷崗位:市場營銷領域的某些崗位,如市場研究分析師和廣告銷售人員,需要處理大量的資料和市場趨勢分析。這些任務可以通過大資料分析和機器學習技術來實作。

(10) 某些法律崗位:法律領域的某些崗位,如法律助理和檔案審查員,需要處理大量的法律檔案和文書工作。這些任務可以通過自然語言處理和機器學習技術來實作。

對企業來講:

(1)首先要進行數字化轉型,将生産、經營資料數字化,将管理流程、生産流程數字化。為後期智能化積累資料。資料是AI的基礎,是AI 訓練的糧食素材。這是迎接AI大模型的前提條件。

同樣到一個目的地,選擇坐汽車和坐飛機,所用時間可相差10倍。使用和不使用AI大模型的企業将來的競争力差距也是顯而易見的。

「詳細」原華為工程師用平民化語言講AI大模型,讀這一篇足矣

圖7:數字化轉型架構,摘自網絡

(2)使用行業版大模型應用或訓練私有資料建立自己的私用大模型應用

A.使用行業版大模型應用

大模型除了在ToC領域的應用外,還有大部分應用場景在ToB、ToG領域,是以将來有行業頭部企業或機構會聯合大模型廠家開發豐富的行業應用,可以直接應用這些工具來為自己服務。

B.建立自己的私用大模型工具

如果需要更精準的服務效果,則可以訓練自己的資料,讓大模型應用更“懂”自己的生産、經營流程以及更“懂”我們的客戶,應用效果也更理想。以華為盤古大模型平台為例:其可支撐的場景大模型即是細分到行業場景甚至個别組織、企業的私有場景。

「詳細」原華為工程師用平民化語言講AI大模型,讀這一篇足矣

圖8:華為盤古大模型平台,摘自華為雲

就像開始招一個會計,他懂通用會計知識,開始能工作但效率低,做的賬也不是老闆滿意的。做着做着,熟悉了公司業務,工作效率提升了,做賬也更符合老闆的要求了。大模型應用也類似,通用的大模型應用可以滿足大部分工作需求,但不是100%的比對。如果要達到100%的比對,那隻得用自己的私有資料投喂大模型,但這種情況老闆有個擔憂,和現在使用公有雲一樣:擔憂資料洩漏,擔心資訊安全。自己的生産資料就是自己産品特色的來源,也是立身之本。

是以,不願意将自己的私有資料投喂給行業大模型,而是需要建立自己的大模型應用。類似培養自己的數字員工,不要社保,不會請假的可以365*24小時工作的全天候員工。每個企業可以有多個數字員工,各自完成自己崗位的工作,并且邊工作邊學習,不斷訓練提升。更加好用,更加高效。也不擔心自己的資料安全和資訊安全了。大模型應用的出現,将會對企業原組織結構發起挑戰,未來需要肉體員工與數字員工協同工作, 即“人+超級助理”的組織模式會是企業的主要形式。

當然開發自己的大模型應用成本會上升,直接使用本行業大模型應用成本低。各企業可根據在目前營運階段的狀況靈活選擇。

(本文題圖來自一個大模型生成式網站 https://thesecatsdonotexist.com/ 不用我解釋了吧!其他圖檔如果原作者有意見可聯系本人作删除處理,謝謝!讀者對本文有不同意見和建議,歡迎留言或聯系筆者探讨!作者: 真平 微信:startbit,郵箱:[email protected])

【彩蛋】這兩個網站可生成某人或某貓,直接用,不存在版權擔憂!

這些人不存在:https://thispersondoesnotexist.com/

這些貓不存在:https://thesecatsdonotexist.com/

「詳細」原華為工程師用平民化語言講AI大模型,讀這一篇足矣

繼續閱讀