機器視覺公司，在玩一局玩不起的遊戲

有個著名咨詢公司曾經預測過：未來隻有兩種公司，有人工智能的和不賺錢的。

它可能沒想到，還有第三種——不賺錢的AI公司。

去年我們報道過“正在消失的機器視覺公司”，昔日的“AI四小龍”（商湯、曠視、雲從、依圖），在商業化盈利上各有各的不順。不過，随着GPT系列産品又掀起一股“大煉模型”的熱潮，這些AI公司又支棱起來了。

商湯科技此前曾披露，下一步的發展戰略是通用人工智能（AGI），繼續推進“大裝置+大模型”，并釋出了1800億參數的中文語言大模型 “商量”。

曠視科技也表态，會堅定投入生成式大模型的研發，保持核心技術能力長期領先。

雲從科技公開的定增預案中，為雲從“行業精靈”大模型研發項目，募集資金不超過36.35億元。

依圖科技沒有公開消息，但在此前的融資中曾因AI大模型和國産晶片等被看好。

無論是上一輪，以BERT、GPT-3為代表的“預訓練+精調”大模型，還是此刻正紅火的，以ChatGPT、GPT-4、文心一言等為代表的“預訓練+精調+提示+RLHF（人類回報）”的大語言模型，已經成為各大頭部科技公司“秀肌肉”、互相競争的重要工具。

谷歌、百度等大廠跑着入場，各路大模型“神仙鬥法”。這場狂歡派對，成了機器視覺公司不得不玩、又玩不起的遊戲。

尴尬的“長衫”

最近，CV公司參與到大模型這局遊戲中，出現了這樣的畫風：語氣一會兒大，一會兒慫。

在公開資訊中，都表示自己會加大投入，去解決基礎技術、基礎問題。雲從的管理者說要“投一二十億解決算力問題”“我們是技術公司，研發投入不會低”；商湯的有關人士稱，要做“統一化标準化的大模型”“加速建構通用人工智能的核心能力”；曠視也對标OpenAI，要“做影響實體世界的 AI 技術創新”。

談到大模型技術和産品本身，底氣又不足了。

這個說“基礎大模型要有長期布局，NLP難點很多，短期内與境外領先企業會存在較大差距”，那個說“中國AI公司有商業化的壓力，不能像OpenAI那樣不計代價的創新”。

“預期管理”算是被你們玩明白了。

年輕人流行說自己是“脫不下長衫的孔乙己”，CV公司對于大模型這種不尴不尬的處境，其實也和“孔乙己”有相似之處。

CV公司在底層技術、基礎設施、人才、資金、生态等領域的積累，不如頭部科技企業優勢顯著。是以，自然也不可能真的跟谷歌、OpenAI、BATH（百度、阿裡、騰訊、華為）正面打擂台，燒錢去做通用的基礎大模型（foundation model）。

新一輪大語言模型，完整技術棧、工程實作能力、算力成本、資料積累等都有極高的門檻，AI公司自研大語言模型的難度前所未有。 OpenAI 在2022年就花掉了5.44億美元，收入隻有3600萬美元，這是國内CV公司不具備的家底兒。

當然，外界也不應該過度放大CV公司的責任，非要将巨頭才能承擔的創新壓力放在CV公司身上。

但是，CV公司又有着“AI-native原生企業”的光環，也确實積累了很多技術儲備，是以也不能直接躺平，像ISV內建商、軟體公司一樣依附大廠，歡欣鼓舞地等着內建或調用API就好。

昔日的“AI四小龍”還是要撐起“技術自立”的架子，努力融入這波煉大模型的熱潮裡，于是，又将模型數量和參數規模的比拼，拉升到了新的競争水準。

比如雲從有NLP、視覺領域的預訓練模型，商湯在“AI大裝置SenseCore”的基礎上，建構的日日新大模型體系就包含了通用視覺模型、中文語言模型、圖檔生成模型……其中，僅“商量”大模型的參數規模，就和GPT-3差不多。

今天大家都感慨，孔乙己脫下長衫不容易，換個角度，“大模型”這件長衫，CV公司是不是有必要穿上呢？

玩不起的遊戲

從2018年的預訓練大模型到2023年的大語言模型，大模型走過了一個從萌芽到繁榮的小周期，種類、功能也豐富起來，我們已經見過很多AI企業、高校和科研機構、行業公司所打造的各種各樣的大模型。

問題來了：

第一，大模型的“智能湧現”，需要在超大規模的資料和充分的訓練才能出現，隻有不計投入的基礎模型能做到。

很多面向行業的預訓練大模型，由于資料和訓練不足，無法達到“智能湧現”的臨界點，這也是為什麼此前預訓練大模型那麼多，卻隻有ChatGPT的到來，才證明了“通用人工智能”的可行性。

在基礎模型的魯棒性、泛化性極大提升的今天，一味盲目地“訓大模型”，結果就是“大小班同上”，基礎大模型和行業大模型一起，消耗本就不充沛的算力，進一步推高計算成本，讓AI企業背上更重的負擔。

第二，大模型的商業化路徑，标準化API是比較基礎的一種，而基礎模型API有虹吸效應。

簡單來說，通過API接入AI能力，技術是決定性因素，基礎模型的能力強、閱聽人廣泛，很容易通過API經濟完成商業化，而行業大模型面對的領域較窄，很難通過“規模效應”來攤薄研發成本。

随着一個又一個大模型被推向市場，大家恍然發現：原來我們并不缺大模型，缺的是商業化路徑。

目前，大模型的商業化還比較有限，C端通用産品貼成本定價，B端盈利前景不明朗，根據 A16Z 對美國 LLM 創業調研，純模型廠商隻能拿走0-10%的價值，并且要長期對标OpenAI的定價政策，會面臨很大的商業化壓力。

通用基礎模型和行業大模型一起面向市場和客戶，結果就是，在商業價值配置設定上産生博弈。AI巨頭“神仙鬥法”，打造出的通用基礎大模型會吸引産業和使用者的最多關注。

而大量行業大模型，要麼在訓完後無人問津，浪費了前期投入；要麼無法滿足産業需求，商業化前景受限；或者跟通用基礎大模型的能力有沖突，導緻商業化達不到預期。

同為AI創業型公司的出門問問創始人李志飛，就在一次采訪中直言：“不是所有人都要去做通用大模型，貿然進入，難度很大，商業競争很激烈，想不清商業模式到最後會很痛苦。”

是以，大煉模型，可能是CV公司目前玩不起的一局遊戲。

輕裝上陣的路

你可能會問，現在大模型這麼火，不訓大模型怎麼能吃到這波紅利，在新一輪AI熱潮裡建立優勢呢？

CV公司要輕裝上陣，可能要嘗試這樣幾條路，去探索大模型熱潮中的機會：

1.跟基礎大模型平台建立更緊密地聯系。

自己開發大模型難度太大，訓練成本、存算成本過高，社群生态支援也不夠充足。可以站在巨人的肩膀上，接入基礎模型的能力打造小模型，與基礎模型的商業模式形成差異。

此前CV公司盈利難的一個挑戰是：機器視覺要進入腰尾市場，存在着海量的碎片化需求，客戶體量比較小、數量多，項目規模不大，這對CV公司的開發效率提出了很高的要求。

通用的成熟型算法，無法滿足細分需求，但全靠算法工程師來定制開發不現實，也不夠經濟劃算。基礎大模型，将算法開發推進到工業化階段，減少了程式設計工作量，提高了開發效率，定制化算法的成本效益提高，也就更容易為企業所接受。

對于CV公司來說，算法進入工業化大生産階段，将碎片化需求全面覆寫、規模化複用，整體營收能力自然也就上來了。

2.深入到具體行業中去，構築能産生差異化的應用産品。

基礎模型要走向産業，必須進一步精調，CV公司就有相應的優勢。

很多高度專業化或複雜的工作，比如金融、建築設計、程式設計、辦公、客服等，需要精準的垂類知識；一些特定領域，比如醫療、司法，非結構化資料比較稀缺。沒有足夠的語料來“投喂”，基礎模型在這些場景就會欠缺一些“常識”，比如GPT-4就寫不好中文詩。

據說，GPT-3.5的訓練資料集全部為私有資料集，其中關鍵的SFT訓練集，有89.3%的資料是定制的。

CV公司大多有自己聚焦的垂直領域，比如依圖的智能醫療，曠視的物聯網，雲從的智慧園區，商湯的智慧城市、智慧出行等，可以結合在相關領域沉澱的差異化資料集，利用精調或prompt的方式，打造出更加精确、可靠的小模型，更容易部署，為AI應用加速AI的快速落地。

3.建立更具韌性的生态合作護城河。

CV公司在大模型技術上的積累，就會變成AI 2.0時代的底牌，也可以作為與AI巨頭、算力提供商的生态合作籌碼。

比如這一輪大模型，對提示學習、人類回報的強化學習RLHF等提出了很高的要求，讓模型在人類的引導下，發現知識的使用方式，了解人類的偏好，這在國内都屬于很新的領域，提示師、專業标注師很少。有媒體報道，OpenAI的标注員，大學學曆52.6%，碩士學曆36.8%，這就不能全部靠衆包模式來進行資料标注，必須擁有自己的垂直領域的标注團隊。

比如醫療領域，醫學圖像還沒有建立起自然圖像那麼大級别的資料庫，而對醫學圖像的标注是很難的，不像自然圖像标注，普通人一看就知道是什麼，醫學圖像的資料标注涉及到器官、癌變等專業知識，就需要針對性地積累。

這樣的高水準技術人員，恰恰是CV公司這種AI-native原生企業的重要資源，可以與産業鍊上下遊開展更緊密地合作，進而保障産品和服務的競争力和可持續性，吸引客戶更多地将資料放入自己的産品中，形成馬太效應。

大模型開辟了一條蘊藏着極大價值和可能性的新路，被寄托了太多期待和野心。要有大模型能力，不代表要自己訓大模型。

重複建設的熱潮終會褪去，屆時，大模型商業化的考驗才剛剛開始。

對于CV公司來說，脫下“大模型”的長衫，是為了留住商業化的“底褲”。集體弄潮隻是隻是一時熱鬧，儲存實力才能在AI江湖中走得更遠。

機器視覺公司，在玩一局玩不起的遊戲

繼續閱讀

人工智能帶來育兒焦慮，澳洲華人家長為子女的未來憂愁

OpenAI o1與人工智能的過去與未來

未來不會被人工智能取代的4個領域，第1個最穩，第4個成本效益最高

Adobe的Project Turntable人工智能工具可在三維空間中旋轉二維藝術作品

陳健淋｜通用人工智能視野下企業資料賦權的類型展開

科學家利用新型人工智能揭開嬰兒學習和發育的秘密

南沙和華為強強聯手！共建人工智能生态基地

2025年人工智能十大趨勢！最新預測→

張藝謀透露《三體》進度：隻拍一部、大幅删改、引入人工智能

法蘭克福書展聚焦人工智能發展與監管

人工智能未來十大趨勢

研學報道|“探索科技前沿引領未來創新”人工智能創新應用博覽會研學之旅啟航

論壇直擊|人工智能創新應用發展領航交流會圓滿舉辦

數字科技、人工智能拯救春晚收視率

DeepSeek出世，人工智能厲害，教師會被取代嗎？讀書還有意義嗎？

一邊大量失業一邊搞人工智能，發展搶了幾億人飯碗，未來怎麼辦？