天天看點

大模型激戰正酣?“小模型”或許才是出路

大模型激戰正酣?“小模型”或許才是出路

作者丨青沐

編輯丨六子

7月26日,OpenAI推出安卓版ChatGPT,雖然目前僅限在美國、印度、孟加拉國和巴西四國使用,但OpenAI也表示,下周将在更多國家推廣安卓版ChatGPT。這讓近期熱度稍降的ChatGPT重回大衆視野。

ChatGPT在上線之初,用僅僅兩個月的時間,就一躍成為曆史上最快突破1億使用者的應用,沉寂了許久的全球科技市場再次沸騰,國内的投資人與創業者,紛紛飛往矽谷取經問道。

面對這一洶湧的AI浪潮,中國的創業者和投資人們行動很快。數月之後,中國科技行業已呈現“百模大戰”的壯觀姿态。2023年上半年,國内就已出現了80多個大模型産品,在最新的資料中,國内市場上已經有130家公司在做大模型。而在全球範圍内,今年上半年新釋出的大模型已超過400個。

中國的大模型玩家們在追逐商業利益和科技未來的同時,也被冠以民族情懷:做中國版的OpenAI。

7月24日消息,安卓版ChatGPT上線前夕,IDC釋出的大模型技術能力評估報告顯示,百度文心大模型3.5拿下12項名額的7個滿分,綜合評分第一。百度副總裁吳甜表示,新版本的文心一言3.5能力已超越ChatGPT 3.5,這是在我們國内開展相關技術工作重要的裡程碑。

大模型激戰正酣?“小模型”或許才是出路

*來源于文心一言官網

科大訊飛則在此前就宣布,将在10月24日對星火大模型進行第三次疊代,全面對标ChatGPT,中文能力實作超越GPT3.5,英文能力與GPT3.5相當。

01

「場景,場景」

事實上,正如前Google科學家、出門問問創始人兼CEO李志飛所說的那樣,中國或許不會存在一個跟OpenAI一樣的組織。

相比ChatGPT這種通用大模型,國内的大模型産品,更多注重應用和場景,即垂直大模型、行業大模型、産業大模型。對此,科技創投圈大佬們的意見幾乎表達了同一個意思。

百度創始人李彥宏早就公開表示:“創業公司重新做一個ChatGPT其實沒有多大意義。我覺得基于這種大語言模型開發應用機會很大,沒有必要再重新發明一遍輪子,有了輪子之後,做汽車、飛機,價值可能比輪子大多了。”

金沙江創投董事總經理朱嘯虎在朋友圈寫道:“不要迷信通用大模型,因為明年GPT-3.5就成commodity(通用基礎設施),而三年後,GPT-4也會是。對于大部分創業者,場景優先,資料為王!”

獵豹移動董事長兼CEO傅盛認為,大模型會分兩條路。一條叫越來越牛的大模型,是“造一個愛因斯坦”。但很多工作崗位不需要“愛因斯坦”,大學畢業生就能做。這是另一條路。我相信一定有大量的人做“平民化大模型”。

華為雲CEO張平安在盤古大模型3.0釋出會上表示:“盤古大模型沒有時間作詩和聊天。參數再多、對話能力做得再好,但如果解決不了實際問題,也沒有多大用處。”

近期國内釋出的大模型,大多都面向垂直産業落地,如京東釋出的言犀大模型,攜程釋出的旅遊行業垂直大模型“攜程問道”,閱文集團釋出的閱文妙筆大模型,網易有道釋出的教育領域垂直大模型“子曰”等。

京東言犀大模型沉澱了京東在零售、物流、健康、金融等行業多年積累的知識,融合70%通用資料與30%京東數智供應鍊原生資料進行訓練,帶來了商品推薦、金融政策、理财規則、物流體驗等領域的能力。京東雲事業部總裁曹鵬認為,單一的大模型技術本身無法直接産生價值,技術隻有放到場景裡,才能産生實際價值。

大模型激戰正酣?“小模型”或許才是出路

*來源于網絡

攜程旅遊大模型問道篩選了200億非結構性旅遊資料,結合攜程現有的結構性實時資料,以及攜程曆史訓練的機器人和搜尋算法,進行了自研垂直模型的訓練,同時投入了巨大人力對旅行通用回複内容進行生成和校驗。攜程創始人、董事局主席梁建章表示,攜程會不遺餘力地為大模型投入,投資數額不設限。

在應用方面,百度近日與聯想在AIGC領域達成合作,聯想私人定制業務全面引入百度文心一格,消費者可通過官網 AIGC 主題繪畫活動定制筆記本電腦外觀。華為雲盤古大模型與美圖視覺大模型MiracleVision合作推出的AI模特試衣功能,可以有效提升服裝類産品的電商上架效率。

垂直大模型雖然不如通用大模型那樣對參數和算力有太高的要求,但對場景和資料有着更高的要求,需要開發者具備專業的知識、豐富的行業應用實踐積累,對錯誤的容忍程度也更低,需要AI具備超強的穩定性和可靠性。是以越到垂直行業,垂直模型的優勢也就更大。

“通用大模型可以在100個場景中,解決70%-80%的問題,但未必能100%滿足企業某個場景的需求。企業如果基于行業大模型,再加上自身資料進行精調,可以建構專屬模型,打造出高可用性的智能服務,而且模型參數比通用大模型少,訓練和推理的成本更低,模型優化也更容易。”騰訊集團進階執行副總裁、雲與智慧産業事業群CEO湯道生表示。

從這個角度來說,“小模型”或許更性感,更能解決具體的問題。

大模型激戰正酣?“小模型”或許才是出路

*來源于商湯官網

商湯推出了千億參數的大模型,也在推出針對不同垂直領域的百億參數小模型。大模型的長處在于能夠找到新的解法,幫助解決新問題,一旦解決以後可以在狹窄領域産生大量資料,重新訓練小模型。有的小模型甚至可以跑在終端上,成本更低。但如果沒有大模型,小模型也不會存在。

02

「大廠赢家通吃,創業公司的機會在哪?」

行業裡有一種觀點認為,中國版的ChatGPT隻會在5家公司産生:百度、阿裡、騰訊、位元組、華為。

網際網路時代,是典型的“721”,第一名吃香喝辣,第二名勉強生存,第三名往後朝不保夕。

眼下,百模混戰,誰都想在大模型裡分一杯羹。但有一個很現實的問題是,大廠做大模型,有着創業公司無法比拟的優勢。小而美的創業公司,想靠三五個人就幹翻大廠,大機率隻是一種幻覺。

大模型激戰正酣?“小模型”或許才是出路

*來源于網絡

大模型離不開雲平台。大模型落地需要不斷進行微調、訓練、都需要在雲平台上運作。百度、阿裡、騰訊、位元組、華為都有自己的雲業務,百度和華為還完成了從還完成了從晶片到應用的布局,百度是“昆侖芯+飛槳平台+文心大模型”,華為是“昇騰晶片+MindSpore架構+盤古大模型”,這都是創業公司難以企及的優勢。

此外,在資金儲備、人才資源、使用場景、資料積累方面,大公司都有着天然的優勢。創業公司沒有落地場景,技術就沒法疊代,無法持續優化,無法形成資料網絡效應。

那麼小公司就一點機會都沒有了嗎?

不妨重提那個淘金時代的喻言:“這個時代跟淘金時代很像,如果你那個時候去加州淘金,一大堆人會死掉。但是賣勺子、賣鏟子的人永遠可以賺錢。”這也是奇績創壇創始人兼CEO陸奇在近期對創業者的分享。陸奇希望幫助中國創業者認清這次曆史性的拐點時刻,定位今天的時代坐标、找準自己的位置。

7月初,加州大學伯克利分校計算機科學教授、《人工智能——現代方法》作者斯圖爾特·羅素(Stuart Russell)發出警告稱,ChatGPT等人工智能驅動的機器人可能很快就會“耗盡宇宙中的文本”,通過收集大量文本來訓練機器人的技術“開始遇到困難”。

上周,8500多名作家簽署了一封信,要求OpenAI、微軟、Meta和Alphabet等公司上司者不要在未經許可或未支付報酬的情況下使用這些作家的作品來訓練人工智能系統,并要求這些人工智能公司賠償其版權損失。

存量的網際網路資料即将被耗盡,優質資料正變得越來越稀缺。一個模型的好壞,20%由算法決定,80%由資料品質決定。在資料、算力、算法“三駕馬車”裡,資料是最核心、最長遠、最基礎性的要素。大模型需要用海量資料進行喂養,才能持續優化、疊代。

接下來,真正的價值将會變成可持續性的高品質資料。如何持續擷取合法合規、合商業邏輯的資料源,将成為大模型性能提升的關鍵因素。是以,資料營運商或将成為制約大模型發展的重要角色。

比較理想的狀态是,模型不斷為使用者提供服務,使用者不斷為模型生成新的資料。至于下一步,則會拼私有資料。更個性化的服務,意味着需要更私有化的資料,而人類不太可能将私人化資料毫無保留地展示給大模型。

任何時代,“賣水人”永遠是一門好生意。頗具意味的是,無論是開創者、探索者還是掘金者,都離不開水。當然也可以賣勺子、賣鏟子。

03

「結語」

前幾個月,社交平台上有一則文章流傳甚廣:

把AI想象成一個小孩。歐美的AI屬于精英教育路線,出生後家裡就一路砸錢供他讀書到博士,等到畢業後,一出場就王炸,驚豔全場。

中國的AI屬于功利教育路線,出生就接受生存養育,養到15歲,就開始逼着他想辦法給家裡掙錢,學的都是如何市場化的技巧。

寥寥數語,細細品來,滋味萬千。

雖然不一定對,但這或許也在某種程度上解釋了OpenAI、ChatGPT為什麼沒有出現在中國。事實上,國内的一些投資人和創業者,在剛開始也是信心滿滿,要做中國版的OpenAI。在折騰了幾個月後,發現還是要尋找盈利模式,探索業務應用場景和商業化的能力。

值得一提的是,近來部分C端使用者感覺到ChatGPT-4在某些任務上性能表現太差,這被認為是OpenAI使用混合專家模型(MOE)進行降本增效,将重心轉向企業級服務的動作之一。

放眼望去,蘋果也在研發自己的大語言模型Apple GPT,高通則已經在研究如何在今年底實作,讓100億-150億參數級别的模型在手機上離線運作,無需雲端處理運算。

大模型是生産力的重塑,是範式轉換。200年前,人類用蒸汽機第一次把熱能變成動能,工業化時代開啟。今天,人類用大模型把電能轉換成腦力和通用智力,一個新的時代正在開啟。

輪子固然不需要太多,但我們仍然需要好用的輪子。

任重道遠。

參考文獻:

《經緯張穎:AI的遠與近》—混沌學園

《大模型,冷靜!》—中國企業家雜志

《陸奇的大模型世界觀》—騰訊新聞

《對話傅盛:大模型的世界不隻有愛因斯坦,還有普通人》—騰訊科技

《非獨家對話李彥宏:真正AI時代,新的應用需要基于大模型的“新地基”》—品玩

《大廠大模型,強在哪?》—定焦One

《大模型應用,必須警惕“速成幻覺”》

- END -

文 | 青沐

合作及進官方群請背景留言聯系

圖 | 來自網際網路