天天看點

吐槽百度“太着急”的人,你不懂

萬衆期待下,百度終于在前幾天交出了“文心一言”的第一份答卷。

作為國内乃至全球網際網路大廠中第一個勇敢“站”出來對标ChatGPT的存在,百度釋出會關注度直接拉滿,也迎來了不少質疑。

圖源:網絡

從釋出會召開之前,就開始流傳确認僞造的、說是需要百度員工頂替“文心一言”回答提問的聊天記錄截圖;再到釋出會結束之後媒體直接将“市值上損失XXX億元”,當作了百度本次釋出的成績總結;甚至是上手實測之後,實際使用口碑有所反彈,許多人又開始吐槽“百度太急了”。

全方位地吐槽與讨論,着實讓百度久違地、狠狠地火了一把。

雖說百度的确選擇了錄制而非現場示範,但關鍵還是在于ChatGPT讓人們自己提前形成的“高期望”:所有人從心底不希望中國錯過這次重要創新變革機會,是以将“文心一言”設定在了能夠與GPT3甚至GPT4相匹敵的高期望上,自然無法避免将幾者進行比較。

而百度選擇盡早釋出文心一言,恰恰也是考慮到時機——為了抓住大模型這次關鍵AI變革,百度已經沒有時間磨蹭,必須往前趕。反倒是那些吐槽百度“太着急”的人,才是真的不了解這次變革的重要性,更沒有看清緊迫的形勢。

大模型,一個即将進入的AI新時代

圖源:百度智能雲

提到AI的落地應用,許多人并不陌生。

包括百度在内的中國科技公司們,通過自己研發AI技術棧,并且打造開放的能力平台,已經助力相當多的企業實作了包括語言了解、文本稽核、文字識别、圖像稽核、圖像識别在内的AI基礎能力落地。

與過去這些單一功能、細分行業場景的AI能力對比,ChatGPT和“文心一言”帶來的不僅僅是自然語言處理(NLP)技術的躍升,更是算力時代“大模型”變革到來的昭示。

在上一波,由CNN卷積神經網絡模型為核心的計算機視覺技術,開啟的AI應用落地浪潮中,很多想積極嘗試AI的企業都遇到了同一個難題:想利用AI,但是獨立收集和标注資料的成本實在太大;大部分的AI資料集和神經模型也無法直接跨領域使用。

最終整個AI市場走入了“孤島式”的發展節奏,在幾個容易應用AI的行業(如安防、翻譯、語音識别、自動駕駛)被覆寫之後,AI的商業應用就陷入了“停滞”。這種“停滞”背後,展現的是上一代AI“智慧能力”的有限,隻能解決相對簡單的特定問題。

ChatGPT的各種表現震驚全場,就是“大模型”路線再次實作了人工智能“智慧能力”突破的最好證明。

舉個簡單的例子:過去為了讓人工智能學會自動駕駛,我們就給它專門提供駕駛相關的圖檔資料,希望直接“訓練”它學會開車。訓練出來的結果在特殊案例(不規範的道路辨別、不遵守交通規則的其他車輛)上頻頻出錯,反倒阻礙了自動駕駛的進一步推廣應用。

而現在,我們可以先用更多的算力資源和時間,把各種圖檔、視訊甚至文字的資訊都丢給它,讓它不斷自我學習,最終形成一個基礎大模型(Foundation Model),随後再套用到自動駕駛這樣的具體應用領域,進行應用相關的優化和調整。相當于在它學會開車之前,先讓它學會辨認世界,實作“智慧能力”水準的突破。

以官方公布的“文心一言”投入為例,訓練資料就包括了萬億級網頁資料,數十億搜尋資料和圖檔資料,百億級語音日均調用資料,及5500億事實的知識圖譜。這些龐雜知識的共同訓練,最終為“文心一言”貢獻了思維鍊和複雜推理能力,讓解答各種各樣的疑難問題成為現實。

在“智慧能力”提升之外,多種資料訓練而成的“大模型”在應用落地和商業化上也有着自己的先天優勢。

不同于過去人工智能的“孤島式”落地發展,每一個大模型都擁有可以對應廣闊的應用場景,在新應用場景落地的同時,還會給大模型本身帶來更多的原始資料,反過來不斷擴充大模型的智慧能力邊界。

最終形成“不斷應用、不斷吸納資料、不斷訓練、不斷增加能力、繼續擴大應用”的大模型能力“滾雪球”發展路線。

哪怕“大模型”對于算力和資金的需求遠比過去多,起碼可以确認沿着這條路線,更有希望讓人工智能逐漸接近更進階别的認知智能水準,甚至是幫助人類決策和探索。

再不着急,就真的晚了

今年2月,外媒爆出微軟對OpenAI 100億美元投資并沒有換來任何股份,隻是階段性的分紅權利(總利潤達到1500億美元時,微軟的分紅權利自動停止)的新聞時,誇張的合作協定一度讓許多人不解。

真正的原因在于——跟過去很多可以“滾雪球”的賽道一樣,“大模型”賽道中的先行者将擁有接近壟斷的優勢。

根據業界測算,大模型的訓練往往起步就需要上千張頂級GPU加速卡,總價值有望超過5000萬,單次跑下來的電費、人力和硬體折舊就要接近500萬元。很多過去在人工智能行業中摸爬滾打的中小公司很可能都訓練不出來有競争力的“大模型”,門檻的提升将會極大地拉開龍頭公司與追趕者之間的差距。

是以從今年1月正式宣布對OpenAI投資起,微軟短短幾個月就召開了一系列的釋出會,并且實作了ChatGPT各種能力在微軟一系列重磅産品和解決方案中的落地,能看出它其實也很“着急”、很“激進”。

這個時候我們再來看百度的“着急”,實在是再正常不過。能夠快速沖刺并且在全球科技大公司中首個輸出成績,證明了百度自身在大模型、AI研究的深厚積累和投入。

百度在NLP大模型關鍵資源如“知識圖譜”、“語義計算”、“閱讀了解”等上有着多年的積累。其中知識圖譜的發展更是能夠追溯到2014年,通過逐漸拓展多源異構知識圖譜的研發與應用,百度在2019年釋出了“文心大模型(ERNIE)1.0”,由其發展而來的ERNIE 3.0,屢屢在全球性的人工智能語義了解競賽中獲勝,如今也成為了“文心一言”的關鍵骨架。

在“文心大模型”之外,百度還擁有國内規模最大的深度學習架構“百度飛槳”,截至2022年底,凝聚了535萬開發者、建立67萬個AI模型,服務20萬家企事業機關,位列中國深度學習平台市場綜合份額第一。作為國内最大的搜尋引擎服務商,百度更是擁有得天獨厚的資料資源優勢。

在關鍵的研發投入上,百度也在逐年加碼,2022年核心研發費用214.16億元,占其核心收入比例達到22.%,比例處于整個科技行業的最頭部。

盡管百度的積累和投入已經相當可觀,“大模型”成長所需的外部“助力”,成為了催促百度這麼短時間内交出成績的“最後一根稻草”。

與過去網際網路時代的打造功能、打造應用思路不同,大模型有兩個關鍵的需求“強化學習”、“prompt”,前者是指将大量使用者的真實應用資料,再次融入到大模型的訓練資料中去,簡單點說,就是它必須要“先用起來,才能越變越聰明”。

“prompt”指的則是要從一開始就去圈定大模型有可能回答的答案範圍,進而讓它在運作過程中更好地了解使用者的問題,相當于提前打打“小抄”,背背一些基礎知識點,是大模型覆寫全新應用場景、行業必做的功課。

通過讓文心一言快速上線,并且逐漸開展内測,百度将能夠擁有更多的使用者回報,并且作為資料融入到訓練當中,優化提升已有應用中的實際表現。通過快速建立生态,則可以幫助文心一言在已有能力範圍獲得快速落地,獲得實際使用者外,還能夠有規劃地拓展應用場景和行業,及早确定整個大模型下一步的訓練方向,實作AI工程與商業化的協調發展。

換言之,“文心一言”的釋出會既是一次“交卷”,也是百度全力踩下的一腳“油門”,更是接下來加速發展的起點。再以過去網際網路時代的産品思路來審視,真的過時了。

圖源:百度

創新時刻來臨,拼了就應該鼓勵

相比産品上的表現,盡管OpenAI很強、微軟全力投入在前,百度仍高調預熱并釋出,積極殺入大模型市場的拼勁,才是最值得普羅大衆所關注的。

跟過去的自研晶片、自研大飛機等重大科技挑戰一樣,AI“大模型”之戰,即将逐漸成為中國不能輸的一場戰争。打破技術封鎖,實作獨立自主發展的唯一辦法,就是全力創新,而且是九死一生的創新。

尤其是目前“OpenAI+微軟”的強力組合,已經威脅到了國内企業“大模型”賽道後續的發展。百度能在這個時候第一個站出來直面壓力輸出成果,就應該鼓勵、提供助力,而不是嘲笑。

隻有普通使用者更包容現有的技術差距、積極使用并且給出回報;産業積極使用,快速拓展整個生态的活力和商業潛力;政策制定者量身定制更鼓勵的營商環境等多方齊心協力,像百度這樣的、肩負創新重任的民營企業,才有可能赢下最終的比賽。