天天看點

梭哈大模型,阿裡雲成了跟風者?

梭哈大模型,阿裡雲成了跟風者?

圖檔來源@視覺中國

文|極點商業, 作者|楊銘,編輯|劉珊珊

這可能是張勇全面掌舵阿裡巴巴7年以來,事關未來最重要的一次“梭哈”。

“阿裡巴巴所有産品将接入通義千問,進行全面改造。”一周前的北京國家會議中心,阿裡雲峰會上,首次以阿裡雲CEO身份公開亮相的張勇,站在舞台中央揭開了“通義千問”大模型的面紗。

這是張勇挂帥阿裡雲後帶來的首個待驗證作品。根據張勇宣布,天貓、釘釘、高德地圖、淘寶、優酷、盒馬等27個阿裡集團旗下APP産品,都将接入“通義千問”大模型進行全面改造。

将所有阿裡産品聚合同一技術架構下,和2015年張勇剛掌舵阿裡時,提出的著名“大中台,小前台”組織戰略路徑非常相似——當然如今回頭看去,“大中台”戰略難言成功,早在2020年張勇就開始自我反思,并在今年史無前例的組織變革中,徹底拆分為“1+6+N”。

如果說當初推出“大中台”是創新者、引領者,但在如今GPT大模型軍備競賽上,阿裡雲卻落後了許多,甚至成為模仿者、跟随者。

不僅是大模型釋出時間晚于國外的OpenAI、微軟、谷歌、Meta,以及國内的百度、華為、商湯,就連阿裡雲智能首席技術官(CTO)周靖人在峰會上提出的“雲智一體”戰略——這一阿裡雲智能集團強調的戰略方向,其實百度早在2020年就已正式釋出“雲智一體”戰略,阿裡雲相比晚了整整三年。

阿裡雲為何此時才提出“雲智一體”戰略?是“抄作業”還是“産業共識”?對于大模型競技場,以及雲市場格局而言,又會帶來哪些影響?

01 雲智一體,阿裡雲“抄概念”?

“智能化時代,大家都站在同一條起跑線上。”面對幾千人摩肩接踵的會場,張勇表示,除了阿裡所有産品都值得用大模型“改造”外,阿裡雲将開放通義千問能力,接入B端企業打造專屬大模型。

通過張勇等阿裡雲高管的演講,可以一窺阿裡雲的勃勃野心:通過對大模型的“All in”,去押注阿裡雲,甚至阿裡集團的未來。

衆所周知,早年占據先發優勢的阿裡,依靠電商大爆發站在中國網際網路巅峰。其進取心、方法論、組織能力、政委體系、使命願景、價值觀等,影響着無數企業家和創業者。

這也包括2015年,張勇成為阿裡集團CEO後,設立的“大中台、小前台”戰略,其目的是提升阿裡集團整體效率,最大限度減少重複造車輪行為,複用已有能力——盡管“大中台”并非阿裡首創,而是來自馬雲去芬蘭參觀一家遊戲公司後的取經,但“大中台”因阿裡而火爆,依然被諸多企業學習和模仿。

近年來,阿裡卻創新乏力,不太跟得上市場、大環境的“進化疊代”,在各種戰場頻繁失利,市值距高峰期縮水近7成。

比如電商領域,京東、拼多多、抖音電商嚴重動搖其基本盤;支付市場,支付寶份額早被微信支付抛下;本地生活領域,從餓了麼到飛豬,無力阻擋美團進攻;雲計算領域,阿裡雲增速下滑、高管動蕩,騰訊雲、百度智能雲、華為雲帶來的壓力重重;大文娛上,發展更是慘淡,收購失敗案例比比皆是。

種種困境下,今年3月28日,阿裡迎來史上最大公司組織架構調整。對每年都會進行組織架構調整的阿裡來說,調整為“1+6+N”容易,最難的是如何尋找到新的發展路徑。

當被認為是下一代網際網路基石,以ChatGPT為代表的AI大模型,被全球所有科技巨頭角逐時,阿裡自然也不會錯過,如同張勇在峰會現場做出的預判:當下技術領域,正是對未來10年、20年形成重大曆史契機的關頭。

但如果與OpenAI、微軟、谷歌推出的大模型産品,甚至是百度相比,“通義千問”在外界,被不少人視為一次是“大躍進式”的面世。

按通義千問自己介紹,該項産品由阿裡旗下達摩院開發,誕生于2022年11月。今年2月,阿裡一名資深技術專家對外爆料,達摩院正在研發阿裡版聊天機器人ChatGPT,阿裡随後确認稱正在内測。4月7日,阿裡雲突然官宣大模型通義千問邀請測試,此後該内容顯示已被釋出者删除。4月11日,通義千問在張勇阿裡雲首秀中高規格問世。

嚴格來看,“通義千問”技術路線、産品形态并不存在太多創新。技術路線上,目前已推出産品的有類ChatGPT模式、多模态混合模式,通義千問類似百度在3月份釋出的文心一言(題外話:古代知名文學理論著作就有文心雕龍、白虎通義),是一款類似ChatGPT的大型預訓練語言模型,具有廣泛的知識儲備和普适性,在訓練過程中學習大量文本資料,進而具備跨領域知識和語言了解能力,适用于不同場景下的需求。

即便張勇提出,要做幫企業打造專屬GPT的通用平台,但事實上,類似“開源”也有雲企業走在前面。今年3月底,百度智能雲正式推出“文心千帆”大模型平台,面向客戶提供企業級大語言模型服務。

梭哈大模型,阿裡雲成了跟風者?

值得注意的是,阿裡雲也首次明确提出,“雲智一體”是其未來戰略。包括阿裡雲智能首席技術官周靖人以《雲智一體,讓智能創新觸手可及》進行演講,以及阿裡雲智能首席商業官蔡英華也表示,隻有雲智一體,才能讓全面産業智能化。

“雲智一體”概念最早由百度提出。2020年5月,百度智能雲宣布由CTO王海峰統領實作雲與AI及基礎技術體系的統一,明确提出“雲智一體”戰略。此後兩年間,以一年一級頻率,百度智能雲完成雲智一體架構從1.0到3.0的進化。

“雲+AI”的融合,其實在國内外雲計算公司中已不鮮見。除了百度“雲智一體”,微軟提出“office+Teams+Azure”,亞馬遜2022年提出“雲、數、智三位一體”,騰訊雲去年提出“雲智融合”,京東叫“數智供應鍊”,阿裡雲此前也有“雲釘一體”——哪怕大家技術路線、概念含義都差不多,都會避諱采用相同的概念。

過去三年,各種場合與财報中,百度都與“雲智一體”進行了強綁定。這也讓業界有所不解,阿裡雲為何還要在三年後,重新提出“雲智一體”概念,是“抄作業”,還是“産業共識”?

02 邏輯還需自洽,實測與宣傳差距有點大‍

無論如何,在業内人士看來,阿裡雲的跟進,意味着“雲智一體”的打通和融合,已經成為産業共識,也預示着雲智一體大産業機會的到來。

阿裡雲高管并未具體闡述雲智一體具體含義。按照百度此前說法,“雲”指的是以雲計算為基礎,使企業在雲上像使用“水電煤”一樣友善快捷地接入AI能力;“智”指的是人工智能,通過飛漿、視覺、語言和知識等全棧技術能力,滿足企業在複雜多變場景下對AI技術的需求。

簡單而言,就是“适合跑AI的雲”疊加“懂場景的AI”,共同打造智能時代基礎設施。

“雲智一體”概念中,核心是智。多年布局發展後,雲已經變成各行各業基礎設施。而能否提供、輸送全面、便捷高效、穩定可靠的AI智能化服務,成為各大科技企業比拼關鍵。

營收增速下滑,在政企、個人雲市場逐漸摸到天花闆的阿裡雲,或許看到的也是同樣機會:憑借“雲智一體”差異化打法,百度形成“晶片-架構-大模型-行業應用”智能化閉環路徑,幫助百度找到面向未來十年的第二增長曲線。可以說,“雲智一體”在重塑百度過程中,相當重要。

另外,随着中國經濟社會數字化轉型加速,萬物互聯時代到來,“深入産業、推動産業智能化更新”明确成為各家雲計算戰略重要部分。

這就更離不開通過“雲智一體”,去承載大模型算力、解鎖AI生産力——事實上,無論是AI大模型,還是其他雲、AI産品矩陣,概念雖然不同,實際上均是基于“雲智一體”底座推出。文心一言、通義千問、360智腦、商湯科技如此,更多其他類ChatGPT産品都是如此。

從“極點商業”實測來看,通義千問給出的回答,整體并不算理想。

通義千問目前隻提供文本生成功能,暫無法生成圖檔、音頻及視訊内容。自然語言處理、中英文對話等方面,通義千問表現尚可,但在基本事實、時間、計算、推理等需要思考認知和邏輯了解對話上,和其他大模型對比目前差距不小。

“魚香肉絲怎麼做”這種千篇一律,在各種模型被廣泛提及的問題,通義千問确實回答得不錯。但是,“極點商業”以虎撲熱門話題“三國演義為什麼隻注重刻畫前期混亂時代,而對最後統一過程輕描淡寫?”提問時,通義千問回答是“很抱歉,目前沒有掌握回答技巧”。

相比之下,文心一言則指出,稱“小說主要情節是描寫三國時期的群雄争霸,最後統一過程隻是其中一個小小情節。這種處理方式使得小說更加注重于描寫前期混亂時代的曆史背景和人物性格,進而更好地呈現三國時期的曆史和人物。”

梭哈大模型,阿裡雲成了跟風者?

“如何看待《生成式人工智能服務管理辦法(征求意見稿)》,拟法ChatGPT提供者應對資料來源的合法性負責”問題上,另一AI大模型給予肯定,指出是加強人工智能監管方面的重要舉措。而通義千問依然是“沒有學會如何回答”。

涉及基本事實、時間線梳理問題上,通義千問可能還沒明白如何回答。比如,“阿裡巴巴過去幾年,經曆了哪些負面事件”提問中,通義千問回答不僅是錯誤百出,甚至出現多處杜撰阿裡公司事實、時間情況。

梭哈大模型,阿裡雲成了跟風者?

“和文心一言相比,通義千問有哪些優勢與劣勢”對話中,通義千問又犯了一個事實性的低級錯誤:稱通義千問和文心一言都是阿裡巴巴推出的AI預訓練模型。

梭哈大模型,阿裡雲成了跟風者?

如此多的低級錯誤,不僅與阿裡雲率先在國内布局雲計算、市場地位不符,更難以承擔阿裡所有産品接入重做,為B端企業打造專屬大模型的野心——畢竟,了解基本邏輯、遵循事實是第一位,如果實測結果不理想,不但會對B端企業的數字化布局造成影響,還會帶給釘釘、天貓精靈等使用者不好的體驗。

按照阿裡雲的布局,智能客服是其重點應用場景——可以幫助阿裡突破傳統電商“人找貨”局限,疊代更新為“貨找人”。并且,在酒旅、本地生活等方面,AI大模型也可以精準營銷,滿足更多消費者真實需求。‍‍‍‍‍‍‍‍

梭哈大模型,阿裡雲成了跟風者?

但是從實測來看,通義千問在智能客服、智能推薦等方面的表現,距離商業化還相當于遙遠。比如“從北京來,去重慶南天湖五一旅遊三天”以及“預算6000元,買什麼抽油煙機和瓦斯竈比較好”問題,通義千問給出的回答,對消費者來說實際參考意義非常小。‍‍‍‍‍‍‍‍

值得一提的是,這些問題是“極點商業”随便提出,并非刻意為之。此前釋出會上,張勇稱通義千問是“世界首個突破10萬億參數的AI大模型”。另外,有消息稱阿裡還牽頭搭建了國内最大的AI模型服務社群“魔搭”。那麼,通義千問生成式AI的邏輯能力,實際上為何如此孱弱?

03 跟風者不容易,阿裡雲還差些什麼

這涉及“雲智一體”的本質——雲必須與智真正的更好融合,才能給使用者更好體驗,讓産業全面邁向智能。

答案或許很簡單,即便阿裡雲有強大的雲計算和AI能力沉澱,但是兩者并未做到很好的融合。另外,資料參數、預訓練資料的規模和品質、資料清洗等方面的差距,也直接關系不同大模型的回答結果,這方面阿裡雲并不具備優勢。‍

有業内人士表示,過去在一些雲廠商内部,AI與雲普遍處于兩個不同體系。售賣計算、存儲等資源型産品成為主要商業模式,導緻AI在産業數字化轉型、智能化更新過程中無法發揮出最大價值。

從“極點商業”了解來看,阿裡雲就是這樣的典型案例。

很長一段時間以來,阿裡的人工智能、雲計算處于兩個獨立體系——在阿裡内部,研究人工智能的部門一度由阿裡人工智能實驗室(AI Labs)和達摩院負責,與阿裡雲是平行部門。

AI Labs是阿裡體系内實驗室,研究語音、語言、機器視覺,後改為天貓精靈事業部,發力智能硬體。直到2021年,AI Labs團隊在架構變動中,才整體并入阿裡雲智能。

研發通義千問的達摩院,更是設于阿裡龐大商業體系之外的一個獨立研究機構,研究範圍包括資料智能、人機自然互動等前沿技術。2021年組織架構更新中,前阿裡雲總裁張建峰負責的“雲與科技闆塊”中,包含阿裡雲、達摩院、釘釘、智能互聯(天貓精靈)、平頭哥五條線。彼時,雖然達摩院AI技術通過阿裡雲輸出,但依然是平行的“兄弟部門”。

部門平行外,對阿裡雲來說影響更大的是連續數年高管震蕩。去年5月,達摩院與阿裡雲出現一系列高管變動,華先勝(達摩院城市大腦實驗室負責人)、金榕(城市大腦進階研究員)、張磊(達摩院AI中心副主任)離職,肖利華(阿裡雲研究院院長)出走創業。一夜間,從王堅時期開始耕耘多年的明星項目——達摩院城市大腦實驗室,核心人員幾乎全部流失。

這讓阿裡雲、達摩院“元氣大傷”,并且加速兩者“分割”。根據“雷鋒網”此前報道,阿裡雲和達摩院2021底進行了人員分割,一些達摩院孵化的産品技術被劃出,而達摩院以更為獨立形式營運,承擔起10位數的營收數字挑戰——具體方式是,達摩院通過阿裡雲業務線對外進行銷售産品,兩者實行雙算模式。

今年1月初,阿裡雲高層再次人事大變動。張勇親自下場接替張建峰,掌舵阿裡雲智能總裁,周靖人擔任阿裡雲智能CTO。但是,随着“大中台”的失效,雲與AI未來是否得到更好融合,成為疑問。

3月28日“史上最大”組織架構變化後,達摩院、阿裡雲都被歸到張勇掌舵的雲智能集團旗下,但依然分屬不同業務闆塊,在業務上有一定的獨立性。同時,高管依舊流失,阿裡AI大牛賈揚清、阿裡M6大模型前帶頭人楊紅霞也已離開。

跟大模型或AI相關核心負責人持續兩年動蕩,帶來的結果就是,阿裡大模型推出遲到,産品能力實際表現更像”趕鴨子上架”。

有人工智能從業人士透露,一個穩定的管理團隊,是産品、技術路線延續關鍵。該人士舉了一個例子,在百度智能雲,百度CTO王海峰+百度技術委員會主席吳華+百度集團副總裁吳甜帶隊的組合,自2019年推出文心大模型ERNIE 1.0系列第一天起,就保持穩定,才有了文心系列的持續疊代。

遺憾的是,對阿裡的雲和AI業務而言,頻頻組織架構調整、人員持續動蕩中,不曾擁有過百度的穩定優勢。

這在大模型上也有展現。阿裡在模型疊代上比百度、華為慢了不止兩年。2019年,當百度、華為推出大模型時,阿裡才開始研發。2021年,其他企業開始對大模型持續疊代,阿裡才釋出了語言、多模态大模型,并在去年9月合并為阿裡通義大模型。

導緻的結果,就是大模型資料品質、規模上的差異。“阿裡大模型與業界或國内領先水準,存在的資料參數、預訓練資料品質和資料清洗等方面,差距明顯。”ICT産業服務平台“集微網”報道稱。

阿裡雲CTO周靖人此前也承認,大模型研發動辄要超千億參數,其難度遠遠超出了單一算法或GPU晶片的簡單堆砌。

其實這種差距在業界預料中。百度擁有海量C端搜尋資料,騰訊也有十多億使用者微信生态資料沉澱,但阿裡擁有最多的是垂直領域的TOB商家客戶資料。從通用大模型訓練角度來看,過于商業化的TOB商家資料,并不太适合大量加入。

通義千問釋出前,一位阿裡雲研究院進階專家坦承,在參數方面,通義千問基于PLUG的模型,參數在200億-300億,而GPT-3參數是1750億,同時其主要偏向文本,沒有涉及圖像和視訊;預訓練語料資料集方面,在品質和規模上都比不上OpenAI和百度。

這可能是阿裡雲“抄作業”,植入“雲智一體”概念的一個原因。畢竟,如同周靖人所表示,當下的AI大模型競争,本質上就是算力競争。其比拼的,是一個囊括底層算力、網絡、存儲、大資料、AI架構、AI模型等複雜技術的系統性工程,需要的是AI雲計算的全棧技術能力。

無論如何,伴随AI大模型潘多拉魔盒打開,雲市場GameChanger已經到來。行業格局大洗牌難以避免,對阿裡雲這個昔日老大哥而言,從“領先者”變為“跟風者”,還有多少機會,去重塑行業規則?

繼續閱讀