天天看點

科大訊飛不講大模型的“性感故事”

作者:财經無忌

文 | 山核桃

2024年的大模型故事,依舊熱鬧非凡。

大洋彼岸外,從Sora的橫空出世到Llama 3再度掀起的“開源 vs 閉源”之争,再到各類內建大模型能力的AI硬體......在通往AGI的征途上,為了讓大模型落地,海外科技巨頭靠着scaling laws(規模定律),并沒有停下腳步。

不久前,OpenAI創始人Sam Altman就在演講中表示:“scaling laws依舊有效,GPT-5将比GPT-4聰明得多,我們還沒有到達這條曲線的頂端”。

scaling laws是一條OpenAI驗證過的道路,通過堆算力、卷參數,提升大模型能力,進而抵達真正的通用人工智能階段。

但回到國内大模型行業,scaling laws所面臨的一個現實難題不僅是以晶片為代表的國内外産業鍊基礎的差距,更關鍵的一個問題是:

如何去發揮從移動網際網路時期中國技術企業的場景和應用優勢,在堆參數之外,找到讓模型高效落地于行業應用的路徑,将實驗室裡的模型能力轉化為看得見的應用價值?

在這一問題上,作為國内大模型行業頭部梯隊的科大訊飛,已率先找到了一條新路。

1、拼底座,破解技術焦慮的“正确姿勢”

回到轟轟烈烈的大模型熱潮,随模型參數量和資料集的增長,大模型的能力邊界進而拓展與疊代,這無疑是scaling laws給國内AI玩家們所帶來的關鍵啟示。

在行業過去殘酷的“百模大戰”裡,盡管國内湧現出諸多行業模型和垂直應用,但如果提及國内大模型玩家的焦慮,排在第一依舊是“技術底座”上的難關,這包含兩個核心問題:一是算力夠不夠用、好不好用?二是對标OpenAI的GPT-4/4V乃至未來的GPT-5等底座基礎模型,國内通用大模型能力能否不斷縮小差距?

在算力層,據李飛飛的估算,最新一代人工智能模型的訓練成本已達到前所未有的水準。比如,OpenAI的GPT-4預計使用了價值7800萬美元的計算資源進行訓練,而谷歌的Gemini Ultra則耗費了接近2億美元的計算資源成本。

回到國内,受地緣政治影響,在美國對華晶片制裁的外部壓力下,國内大模型玩家不可避免地面臨算力稀缺等問題。同時,大卷算力所帶來的高昂算力成本,也擡高了大模型落地的門檻,算力太貴也是一大現實難題。

緩解大模型落地的算力焦慮,上到國家政策支援,下到企業布局,均在行動。不久前,北京市釋出《北京市算力基礎設施建設實施方案(2024—2027 年)》,明确指出,将大力推動人工智能大模型與自主可控晶片開展适配,提升大陸智能算力産業供應鍊的安全性、穩定性和堅韌性。

作為中國人工智能的“國家隊”,科大訊飛給出的思路是,打造國産化自主可控的算力底座,為大模型行業提供新的“算力選擇”。 為此,科大訊飛同華為強強聯手,在算力底座上合力打造出了首個萬卡規模的國産算力平台“飛星一号”,華為的硬體能力結合科大訊飛的AI技術沉澱,一個自主可控的算力底座為國内大模型生态注入了新的活力。

在此基礎上,底層模型能力的競賽也在同步進行,國内外科技巨頭都在加速追趕與超越GPT-4,對通用模型能力進行疊代。

在國内大模型玩家中,科大訊飛為數不多對外公布其模型疊代具體時間表的科技企業。今年1月30日,科大訊飛釋出的“訊飛星火V3.5”,在邏輯推理、語言了解、文本生成、數學答題、代碼、多模态各個能力方面均實作大幅提升,整體性能已接近GPT-4 Turbo。

科大訊飛不講大模型的“性感故事”

不久前,科大訊飛又宣布了V3.5版本的能力更新,聚焦使用者高效知識擷取的長文本、長圖文和長語音功能。以如今已成為大模型“标配”的長文本為例,目前星火大模型的通用長文本能力總體已達到GPT-4 Turbo,且在多個垂直領域的知識問答任務上,星火大模型長文本總體水準已超過GPT-4 Turbo。

科大訊飛不講大模型的“性感故事”

一個行業共識是,随着模型技術的收斂與行業競争格局的演變,2024年,大模型的競争焦點依舊落在通用大模型能力上。一方面,通用大模型的能力優劣決定中國大模型産業能否掌握自己的核心話語權;另一方面,唯有底層通用大模型能力持續提升,追趕國際最先進水準,行業大模型才能有更好的成效。

圍繞算力和通用模型上的持續加碼,這是夯實技術底座的必由之路,也是破解技術焦慮的正确姿勢。 這也意味着,圍繞技術底座的研發投入,也決定着國産模型廠商的未來身位。

科大訊飛在研發投入上有自己清晰的節奏和政策。在近期公司業績說明會上,科大訊飛董事長劉慶峰透露,2023年,科大訊飛基礎大模型研發和行業應用研發中的比例約為7:3,今年,依舊會把50%的研發投入用于大模型底座能力上。劉慶峰預測:“中美之間的底座模型能力還存在半年到一年的動态追趕過程,但中國是唯一不會被徹底甩開的國家,科大訊飛作為中國的國家隊正在持續縮小與美國同行的差距。”

2、拼落地,科大訊飛的“雲、邊、端”之道

在scaling laws給大模型玩家們帶來的“卷技術底座啟示”外,眼下,告别火熱吸睛“參數”等性感概念,大模型的競争已進入到下一賽點——無論是做應用,還是搶客戶,關注的重點都放在了模型落地和應用的廣度與深度上。

海外如微軟、谷歌等科技巨頭,不僅已加速将大模型能力內建已有産品矩陣中,同時也與諸多行業頭部客戶開展AIGC領域全方位的合作。

客觀來說,在“大模型如何落地”這一問題上,行業至今未能有人給出完美的範本答案。背後原因有兩點:一是從供需兩端看,由于大模型技術發展依舊屬于早期階段,需求方對自身業務落地大模型的需求和價值還在摸索,而作為供給方的模型廠商也在通過供給創新找到落地的範式。二是大模型技術是一種“生産力”,落地産業就需要建立起供需兩端的循環體系,各參與方都要“有利可圖”,比如行業和産業端需要的是更有成本效益的大模型,而模型廠商同樣需要借助大模型實作變現。

大模型如何卷“落地”?科大訊飛給出的解題思路是——從現實的場景需求出發,“雲、邊、端”一體化、全場景布局,來滿足各個複雜多元場景對大模型的需求。

科大訊飛不講大模型的“性感故事”

在雲側,科大訊飛在開始大模型技術攻關時就确立了“1+N”的大模型體系,在基礎通用大模型外,同步面向各個行業落地行業大模型與産品應用 ,比如教育大模型、醫療大模型,同時攜手金融、能源、汽車、通信、化工等領域龍頭企業共同打造行業大模型。

于此同時,面向開發者,除了開放API和RAG、Agent等大模型配套能力方案,也開源了訊飛星火-13B模型,支援行業進行場景化定制微調。在過去不到3個月的時間裡,科大訊飛就新增了55萬實名認證的開發者,其中一半以上的應用服務落地于企業剛需場景。

訊飛星火APP也在獲得越來越多使用者的認可。據七麥資料顯示,訊飛星火APP在安卓端的下載下傳量已經超過9600萬次,在國内工具類通用大模型APP中排名第一。

科大訊飛不講大模型的“性感故事”

在邊側,針對企業的私有化部署需求,科大訊飛與華為聯手打造的“訊飛星火一體機”可針對企業的高頻場景應用需求, 提供“開箱即用”的大模型一體化解決方案,目前已落地城市、金融、營運商、制造、能源、汽車等諸多行業場景。

在端側,科大訊飛一方面将大模型能力落地學習機、翻譯機、辦公本等自有智能硬體,另一方面,将大模型的能力深度賦能行業 ,正在落地汽車、家電、機器人、AI手機、AI PC等領域,在人們觸手可及的終端産品上,帶來體驗的更新。

比如,汽車場景中,通過端側小模型+雲側大模型協同,既能夠解決使用者在無網弱網環境下的互動,還能更好地保護隐私,對于簡單問題直接在本地端解決,複雜問題在雲端解決,既能給使用者帶來很好的體驗,也能夠有效降低成本。

“雲、邊、端”布局帶來的利好是雙重的。

首先,開年以來,為大模型技術能力找到最佳的入口與載體,已成為業内共識,“三劍齊發”能更大範圍内釋放大模型的落地價值,将大模型引向一條實用的路徑。其次,對科大訊飛而言,“雲、邊、端”協同可以更好地滿足各種場景中的應用需求,不同尺寸的模型組合使用,成本更低、效率更高,為其商業化提供了更多的通路。無論是大模型賦能的智能硬體銷量表現,還是開發者的快速增長,都顯示科大訊飛走在商業化的前列。

不過,“雲、邊、端”的布局并非人人可做,人人能做。

科大訊飛的優勢在于從後端技術到前端應用場景的系統化能力。 在後端技術層,一方面是基于國産自主可控軟硬體底座所打造出的不斷疊代的星火通用大模型,另一方面,是科大訊飛從模型、架構、工具和應用層的全棧技術布局。

在前端應用場景上,科大訊飛憑借過硬的工程化能力,在效果接近無損的情況下,讓模型尺寸具備“七十二變”的能力,進而實作大模型地高效部署。

據了解,科大訊飛面向不同場景和硬體平台, 提供從面向雲端百B級、十B級到面向端側硬體的B級模型,覆寫雲+端各類場景和應用,以此滿足各行業複雜場景模型需求。

此前科大訊飛推出13B長文本大模型就是一個例子。在大模型廠商集體“卷長文本”的時代,與動辄千億參數的大模型相比,科大訊飛通過對模型尺寸的“剪枝”和“蒸餾”,從小搏大,推出了業界性能最優的130億參數的大模型,在效果損失僅3%以内的情況下,星火在文檔上傳、解析處理、知識問答的首次響應時間和文字生成方面都有了極大的效率提升。

科大訊飛不講大模型的“性感故事”

“雲、邊、端”的全場景布局,從後端技術到前端應用的互相支撐,既延伸了模型落地的廣度,科大訊飛為大模型落地找到了更多的場景,也拓展了模型落地的深度,行業積累的資料、knowhow能進一步反哺模型能力的疊代,這是一個更健康的循環。

3、拼價值,少有的“技術務實派”

在不少業内人士看來,2024,是大模型落地應用的關鍵之年。從開年伊始,無論是在行業大模型領域,抑或是更輕量化的SaaS企服市場,圍繞應用場景的“大模型化”成了行業玩家的統一動作。

對比國外大模型生态,中國大模型的優勢正在于應用。一方面,中國完備的産業生态下具備廣泛的場景基礎,這是大模型落地的天然優勢。另一方面,從移動網際網路時代,中國科技企業所沉澱出的應用與場景創新經驗,同樣可以複制推廣到大模型時代。

但盡管如此,在應用場景上,圍繞大模型的“價值争議”也同樣存在。大模型的價值究竟在哪裡?AI企業大舉開發大模型又是否隻是一種FOMO(害怕錯過)的心态?

在這一問題上,科大訊飛的态度則顯得尤為務實。一方面,作為老牌AI企業,押注AI技術二十餘年,科大訊飛對AI技術的商業化探索貫穿這家企業發展始末。

另一方面,在價值理念上,在公開場合,科大訊飛董事長劉慶峰曾不止一次對外闡述“應用場景的重要價值”,劉慶峰曾明确表示,在大模型領域,“誰能在具備社會剛需的應用場景落地,誰就能最先形成自我造血的良性循環。”

了解這一點,依舊需要回到科大訊飛BC兩端的大模型應用落地探索中來。

在to B端,國内B端業務鍊條長、個性化強且服務運維重,過去國内to B業務常常是“人要适用機器”,但科大訊飛在做得是“讓模型更好地适應人與行業”。

讓模型适應行業與人,不是光調用API接口那麼簡單,而是需要對行業場景與使用者需求進行深度了解與挖掘,這是發揮模型價值的充分必要條件。

以“大模型上車”為例,在眼花缭亂的諸多營銷與技術概念背後,科大訊飛關注的是“價值端”:一是對車主而言,大模型是否提升了用車體驗?二是對車企而言,大模型是否為其帶來業務增量?

沿着上述兩個思路,就能了解科大訊飛的實踐。在今年的北京車展上,科大訊飛就展示了其自研全新一代“訊飛星火+座艙”解決方案,将星火大模型的能力與用車場景緊密結合,利用大模型技術重構人車互動體驗,這一智能座艙解決方案的部分能力已在星途星紀元ET、昊鉑GT、魏牌藍山、大衆ID.UNYX與衆等車型落地。

2023年中國汽車“出海”超522萬台,出口增速達56%,首次超越日本成為了全球領先的汽車出口國。大模型技術也在賦能中國汽車“出海”,據了解,訊飛車載智能語音系統覆寫23個主要語種,已定點出海車型超60個,合作車型已銷往亞洲、歐洲、澳洲、非洲、美洲等地的多個國家與地區。在中國汽車出海十強企業中,已有8家企業和科大訊飛達成深度合作。

科大訊飛不講大模型的“性感故事”

在家電領域,接入訊飛星火大模型能力的家電行業也正煥發出新的活力。如科大訊飛和海爾共同打造的家電領域大模型,在智能控制、食譜定制、智能客服等領域率先落地大模型應用場景,讓家電變得真正“更懂人心”。三星的電視語音助手同樣結合訊飛星火大模型能力,實作了AI智能問答和智能搜尋。

軟體等企服市場同樣是科大訊飛“剛需場景”理念的展現。借助訊飛星火不斷疊代的代碼能力,科大訊飛不僅在内部使用上了“AI程式員”,還與軟通動力、交通銀行等行100多家企業合作,将“AI程式員”推廣複制。

在營運商市場,基于星火大模型基礎能力,科大訊飛聯合營運商打造通話大模型,并與中國移動聯合釋出5G新通話“商務速記”産品,商務人事工作電話可以友善實作轉寫和摘要,解決使用者聽不清、記不全的痛點,“AI秘書”實作使用者人手一個智能接聽助理。

公開資料顯示,目前,訊飛星火大模型已與汽車、金融、能源、軟體、家電、營運商等各行業領軍企業合作,大模型落地千行百業的勢頭強勁。

而在to C端,科大訊飛則是典型的“産品思維”,從技術中來,到産品中去,追求更好的使用者體驗。

大模型加持下的智能硬體,在科大訊飛的業務版圖中表現十分亮眼。财報顯示,2023年,訊飛AI學習機整體收入增長達到120%,訊飛智能辦公本、訊飛智能錄音筆、訊飛智能翻譯機等智能辦公硬體GMV同比大增84%。

業績提升、GMV增長的背後,是C端使用者對大模型技術的認可。以AI學習機為例,幾乎每一次的底層通用模型更新,科大訊飛均會對智能硬體産品進行一次功能疊代。目前,AI學習機已擁有了英語口語陪練、中英作文批改、數學互動輔學、百科自由問答、親子教育助手、智能程式設計助手等8款大模型應用。

在最新的春季上新中,結合星火大模型長文本、長圖文和長語音的更新,訊飛AI學習機産品,不僅提升在作業批改等任務上的精準性,同時也結合多模态能力更新了“百科問答”功能。融合了大量圖書知識的星火大模型,成為了孩子們的“百科全書小助手”,孩子們可以和“愛因斯坦”等虛拟人朋友“一問一答”,在生動有趣的互動中,提升學習能力與提問能力。

科大訊飛不講大模型的“性感故事”

除了學習機等成熟硬體産品,科大訊飛還在積極布局下一個風口。在如今“具身智能”掀起融資熱潮時,很多人并不知道的是,這一國内外科技大廠争向競逐的機器人賽道,科大訊飛早在2022年就釋出了“訊飛機器人超腦平台”,面向開發者提供了全棧的工具鍊,包括模型訓練、資産生成和軟硬體接入等。

而在大模型到來後,科大訊飛又迅速将星火大模型與“機器人超腦平台”進行了深度融合,科大訊飛如今已和頭部人形機器人明星公司中展開了合作,如智元機器人、優必選、宇樹科技等炫酷的人形機器人産品背後,是訊飛全鍊路語音與星火大模型的加持。

科大訊飛不講大模型的“性感故事”

從拼底座、拼落地再到拼價值,從這一點來說,比起那些炫酷十足的PPT展示,科大訊飛的大模型實踐似乎并不“性感”,但卻足夠接地氣。科技史曾告訴我們,無論是iPhone之于智能手機,還是chatGPT之于大模型行業,技術實作颠覆的前置條件,是讓技術紮根需求與場景。

而科大訊飛的這一“務實”,讓我們看到了在大模型熱潮之下,更期待看到的場景——在不久的将來,大模型能迎來“星火時刻”,真正在千行百業中落地生根。

繼續閱讀