天天看點

AI應用路線圖:可控性是最強路标

生成式AI的可控性越強,對市場和産業的颠覆性就越大!

作者 | 王詠剛、童超責編 | 夏萌

AI應用路線圖:可控性是最強路标

生成式 AI 的應用場景在哪裡

Stable Diffusion、ChatGPT等生成式AI技術(Generative AI)在2023年上半年吸引了IT創投圈的最多注意力。當我們稍稍從波瀾壯闊的新技術浪潮中回過神來,開始認真思考到底什麼樣的應用場景才是生成式AI的最佳落地方向時,很多人還是會發現,科技與市場之間的關系錯綜複雜,很難梳理出生成式AI落地的最佳路徑:

  • 某投資人:這幾個月來,一線風投機構全體動員,忙得昏天黑地,結果發現除了四五家頭部大模型創業項目被大家追捧外,其他AIGC項目都看不清,不敢投,不知道未來AI應用會向哪裡發展。
  • 某分析師:幾家頭部大模型項目投入大,風險也高;所有B端、政府端應用受限于私有部署和私有資料的制約,周期長,難落地;C端應用大部分都太淺太薄,文本和圖像生成項目同質化嚴重;有一兩篇好論文就出來創業的現象很普遍,但團隊自己也想不清具體應用落地方向……

這裡面最大的思維症結是:

  • 大多數人還是在潛意識裡把生成式AI看成是一組生成對話、文章、圖檔的工具。按這樣的刻闆印象:這東西隻能幫文案工作者、設計師提高提高效率,哪裡稱得上颠覆式的變革?
  • 雖然有許多迹象表明,生成式AI顯露出通用人工智能(AGI)的曙光,但受限于短期價值判斷的人總會說:曙光又怎樣?眼見為實。今天的AI不還是在聊天兒、寫文章、畫畫兒嗎?

顯然,僅停留在單一視角或單一時間節點來分析生成式AI的應用前景是不可取的。有沒有串聯起生成式AI的發展脈絡,簡明易用的思考模型呢?

AI應用路線圖:可控性是最強路标

圍繞可控性建立思考模型

我們認為,生成式AI是可以與桌面計算、移動計算相提并論甚至更具颠覆效應的資訊産業革命。颠覆式變革從來都不是一蹴而就,而要随着生成式AI的不斷發展、不斷進步逐漸實作。如果想看清、看透生成式AI即将帶來哪些新産品、新平台、新市場、新機會,我們覺得,有一條簡明易懂,也易于指導産品選型、項目選型的思維路徑:生成式AI的可控性越強,對市場和産業的颠覆性就越大!這條路徑可以簡單用一張圖來表示:

AI應用路線圖:可控性是最強路标

随着生成式AI對生成内容的可控性不斷提高,生成式AI适用的應用場景也會不斷擴充和深化。量變引起質變。一旦突破領域門檻值,生成式AI就可以徹底改造現有的産品生态,為産品賦予真正的智能元素。演進過程中,生成式AI的可控性大緻會經曆六個階段。以最基本的文本生成為例:階段1:不可控20多年前,基于N-grams算法的統計語言模型也可以生成連續的文本内容。隻不過,生成的結果基本不可控。如此早期形态的“生成式AI”幾乎沒有轉化到産品的可能性,更談不上颠覆已有市場了。階段2:概略方向可控從基于LSTM或RNN的文本生成,到早期GPT(如GPT-2)的文本生成,生成式AI逐漸擁有了描摹一段類似人類語言文字的能力。這一階段的描摹能力,基本可以達到文句通順,内容大緻符合人類給出的提示,但因為細節、結構或邏輯不可控,還是很難轉化成真正有用的産品。階段3:結構或局部邏輯可控從GPT-3到ChatGPT(GPT-3.5),生成式AI第一次擁有了對生成内容的結構和局部邏輯的控制力。文字創作和多輪會話是這個時期的兩種典型應用生态。前者可以支援自動文章摘要,法律文書生成,營銷文案生成等實用場景,後者則可以滿足會話式搜尋,語言學習,智能客服,虛拟人,智能遊戲角色的部分需要。階段4:初步的思維鍊可控從GPT-3.5到GPT-4,生成式AI的邏輯推理能力顯著提高。生成式AI第一次擁有了強大的分析能力(如從新聞報道中提取資料,總結趨勢),控制能力(如将人類語言轉化成複雜系統控制指令)和初步的邏輯推理能力(如解答簡單的數學、邏輯題)。可生成的文本内容也擴充到資料、表格、代碼、指令序列、工作流或工具鍊等結構化、半結構化文本。這直接引發了今天一大批以Copilot(直譯為“副駕駛”)為特征的新工具、新系統。階段5:複雜邏輯推理可控當然,今天的GPT-4生成文本時,可以控制的邏輯思維鍊還處在初級階段。如果一切順利,人類有望在不太遠的将來研發出可精确控制複雜邏輯推理的下一代生成式AI。這樣的AI具備記憶、學習、規劃、決策等進階邏輯推理能力。這些能力足以在效率工具、内容平台、商業流程自動化、機器人、作業系統、智能裝置等場景裡,徹底颠覆過去數十年的人機互動形态,重新定義人類與計算機的關系。階段6:規則或原理可控更前瞻一些看,人類思維的最高階表現是:一、基于歸納思維發現原理、制定規則;二、基于演繹思維将原理或規則應用到具體場景中。生成式AI的理想進化形态是接近人類思維方式,生成與人類思維水準相當的規則或原理,并加以應用。一旦達到規則或原理可控的“自由王國”,生成式AI必将擁有強大的自我疊代、自我改進的能力,可以像人類一樣設計系統規則、世界規則,甚至與人類科學家一道開展科學研究。

AI應用路線圖:可控性是最強路标

可控性與典型應用方向

生成式AI可控性的提升帶來适用領域的大幅擴充。我們用下圖概括生成式AI在不同發展階段,可控性與最佳應用方向之間的關系:

AI應用路線圖:可控性是最強路标

以可控性為脈絡,生成式AI在每個發展階段,支援的應用方向不斷擴充、深化,從滿足簡單、局部需求,逐漸發展到滿足領域、平台需求,并最終積累到産品和商業模式的颠覆性變革。思維鍊、邏輯推理是否可控,在多大程度上可以精準控制,是這個量變到質變過程裡最關鍵的因素。

AI應用路線圖:可控性是最強路标

可控性與具體應用案例

以生成式AI的可控性為脈絡,我們将今天和近未來的生成式AI最适合的應用方向分成四個大類,并用下圖将每個大類中的典型應用案例與生成式AI的不同發展階段關聯起來:

AI應用路線圖:可控性是最強路标

内容建立工具/内容平台内容建立工具是生成式AI落地最直接也最快捷的場景。随着生成式AI可控性的提升,内容建立任務會從簡單的文本、圖檔建立,過渡到複雜的視訊、3D、動畫、遊戲、影視、虛拟世界等的自動建立。借助AI,每個普通人都将擁有原本隻屬于專業團隊、專業工具的能力。普通人的創作欲一旦得到大幅釋放,有關新内容形式的分享、觀賞、購買、社交等更高層級的需求就必将帶動新一代内容平台的誕生、發展和壯大。商業自動化/企業服務限于資料安全、私有部署、内容準确性及合規性等原因,商業流程對生成式AI的可控性要求非常高。今天的生成式AI最适合落地的商業領域可能包括市場營銷中的内容建立和電商的使用者界面。此外,生成式AI也可以通過自動生成SQL等中間代碼,自動采集分析資料,自動生成報表,自動連接配接業務流程等,大幅提高商業效率。未來,随着生成式AI可控性的提高,商業流程中的規劃、決策、優化等關鍵過程,一定會吸納更多的前沿AI技術。個人助理/專業助理個人生活和辦公場景中,生成式AI将逐漸以各類不同形态的“助理”身份,在數年内建立起人與AI互相協作的新生态。生成式AI的可控性有多強,從根本上決定了我們生活或工作中的AI助理有多聰明,可以幫我們解決哪些問題。一旦生成式AI在一部分工作中具備與人類文秘、司機、譯員、律師等角色相當的水準,AI助理就會成為替代計算機、手機的新一代大衆電子産品。基礎架構/開發工具/作業系統/搜尋引擎生成式AI的程式設計能力,資料處理能力,系統設計能力,知識處理能力等,将為開發工具、資料庫、搜尋引擎、作業系統提供全新的設計理念和跨時代的新功能。未來是否能真正誕生AI為核心的作業系統,AI為核心的智能計算平台,完全取決于生成式AI的複雜邏輯推理能力到底能達到怎樣的高度。

AI應用路線圖:可控性是最強路标

多模态AI的應用能力演進

與簡單的文本生成、圖檔生成相比,包含聲音、視訊、3D場景、動畫、複雜故事線的多模态系統與人類的常識感受和本源需求更加契合,明顯擁有更寬廣和深遠的應用前景。有關多模态AI的技術現狀和前景展望,可以參見本文作者的另一篇文章:後GPT時代,多模态是最大的機會 在多模态領域,我們認為,今天和未來的生成式AI會大緻按照下圖所示的脈絡演進積累,不斷催生有革命意義的新應用、新平台甚至颠覆性的新商業模式:

AI應用路線圖:可控性是最強路标

以上所有應用路線圖的圖檔和文字内容,均由 SeedV 實驗室以 CC BY 4.0 協定釋出,github.com/SeedV/generative-ai-roadmap作者簡介:

  • 王詠剛:SeedV實驗室創始人兼CEO,創新工場AI工程院執行院長
  • 童超:SeedV實驗室聯合創始人兼首席産品官

繼續閱讀