天天看點

英諾合夥人王晟:近3年重點投AIGC基礎設施,應用端沒有太好的标的

英諾合夥人王晟:近3年重點投AIGC基礎設施,應用端沒有太好的标的

英諾合夥人王晟:近3年重點投AIGC基礎設施,應用端沒有太好的标的

《AI未來指北》欄目由騰訊新聞推出,邀約全球業内專家、創業者、投資人,探讨AI領域的技術發展、商業模式、應用場景、及治理挑戰。

文 / 騰訊科技 周小燕

ChatGPT的出現,像極了2007年iPhone出世的時刻:由于基礎設施不夠成熟,人們很難想象未來的應用産品畫像 。但曾經iPhone掀起移動網際網路創業浪潮的經曆,讓如今的投資人和創業者蓄勢待發,時刻為新的“iPhone時刻”的到來做準備。

從2020年GPT-3出現開始,英諾天使基金合夥人王晟就一直關注生成式預訓練模型的機會,在期間做了很多相關的思考和探索,他将新一代AI的投資自下而上分為三個層次:AI Infra、大模型和應用。

英諾合夥人王晟:近3年重點投AIGC基礎設施,應用端沒有太好的标的

他認為,當下算力、模型訓練架構層面還存在需要補足的地方,我們正處于完善AI訓練和運作(推理)所需的基礎設施的階段,應用端還沒有太好的投資标的。可以一邊搭建基礎設施,一邊等待新的應用機會和商業模式出現。

在大模型闆塊上,王晟認為“AI for Science”的想象空間非常大,在諸如航空航天、軍艦甚至建築和半導體設計方面,AI可能可以替代頂級科學家的計算和求解能力。

核心觀點:

1、小模型的核心問題是無法泛化,它太“愚蠢”了,現在鼓吹小模型的無非是2個點:

第一,大模型貴,但這是成本問題,後續通過工業化、規模化方式可以解決這一點,核心還是如何滿足使用者需求;

第二,在有的場景裡面,我們可能無法使用大模型,諸如對實時性要求較高、或者功能單一的IoT裝置,比如:智能攝像頭、智能降噪耳機,在這些闆塊小模型确實有一定需求,但主流的範式不會是小模型。

2、在移動網際網路的創新湧現之前,各行業也都是原先業務的“大家夥”做一個遷移、換個流量入口而已。在AI時代也是,先是底層的Infra完善、工具鍊完善、開發環境完善,然後湧現創業者,再做業務移植。如果隻依靠移植,這個時代不會産生什麼真正的投資或創業機會,隻有等“移植”階段過去,才會真正進入到模式創新的時代。

3、我們現在處于AI Infra時代,傳統業務正逐漸遷移到AI中,在這個時代可能沒有太好的應用端投資标的,主要的投資機會還是在基礎設施上。基礎設施投資是一個長期的過程,但最重要的視窗是在當下這個時代,後面的投資視窗可能會遷移到比如商業模式創新的闆塊了。

4、“AI for Science”闆塊非常值得關注,這個闆塊最重要的是“科學計算”,但主要是微軟和DeepMind在做,創業公司可能沒什麼機會。比如我們要設計一個大飛機,需要很多空氣動力學上的研究,目前都是需要依靠極其頂級的科學家來設計和求解、論證。如果AI來做這件事情,它就能解決很多問題,包括航空航天、軍艦甚至建築和半導體設計。

5、大模型+自動駕駛面臨的挑戰非常大,最大的問題是它對錯誤的容忍度太低。ChatGPT胡說幾句話無所謂,但用在自動駕駛上,哪怕是百分之一或萬分一的錯誤,都可能會出現很大的安全問題。

英諾合夥人王晟:近3年重點投AIGC基礎設施,應用端沒有太好的标的

英諾天使基金合夥人 王晟

以下為訪談内容整理:

騰訊科技:這半年因為AIGC領域的關注度較高,一級市場的投資氛圍也很“卷”,大家都在尋找各種投資機會,投資人群體在這段時間的心态是怎麼樣的?

王晟:絕大部分投資人是比較焦慮的,但也不完全是因為大模型,現在整個經濟環境和投融資環境都比較令人焦慮。整個金融市場環境不利于資金流動,而較差的資金流動性不利于項目退出,進而形成一個不好的循環:沒有退出就會影響募資,影響募資就會影響投資。

在投資人群體裡面,相比較于人民币基金,美元基金投資人會更“沖動”一些。在過去,由于政策的原因,新能源或硬科技創業團隊不太敢要美元的錢,但AI對美元VC而言是一個很好的投資視窗,畢竟傳統的人民币基金很難承受AI創業公司的長周期投資要求。

騰訊科技:在這波熱潮裡,英諾基金的投資心态是怎樣的?

王晟:我們比較淡定,因為我們在大模型領域已經深耕很長時間了。去年6月份,我們投資了預訓練模型技術服務商深言科技,它的主要目标是用NLP技術,尤其是大模型(LLM)技術,全流程服務資訊處理。

如果追溯到更久,實際上在前年(2021年)下半年,我們内部就非常确定,未來是大模型的世界,小模型的機會不多。

當然,關于大模型和小模型誰更有機會,目前依舊存在争議。在一些對安全性要求比較高的特定場景裡,比如政府、企業等組織确實需要部署一些私有模型,但這并不代表整體市場的發展方向。我認為未來的主流方向在大模型,沒有小模型的世界。大模型像雲服務一樣,它是新一代網際網路業務的基礎設施。

本來我們預估這兩年大模型的投資熱度會緩慢升溫,但Open AI突然釋出ChatGPT,一下子點燃了這個賽道,突然湧現出很多大模型團隊,我們剛開始看這個賽道的時候根本不存在這些團隊。

騰訊科技:你們前年就發現大模型是趨勢,小模型沒什麼機會,當時經曆了哪些實驗得出這個結論?

王晟:小模型的核心問題是無法泛化,它太“愚蠢”了,比如今天小模型能認出農夫山泉,明天把農夫山泉瓶子換成藍色的,它可能就不認識了。現在鼓吹小模型的無非是2個點:

第一,大模型貴,但這是成本問題,後續通過工業化、規模化方式可以解決這一點,核心還是如何滿足使用者需求。

第二,在有的場景裡面,我們可能無法使用大模型,比如對安全性要求比較高,或者功能單一的IoT裝置,如智能攝像頭、智能降噪耳機,它對實時性要求太高,大模型跑不進去。從這個角度來看,小模型确實有一定需求,但主流的範式不會是小模型。

大模型會成為主流,其中語言大模型是人工智能皇冠上的明珠,畢竟人類的知識大部分以語言文字的方式承載,維特根斯坦講人類語言的邊界就是我們思維的邊界。除了語言大模型之外,我們也非常關注其他模态的AI大模型,比如:圖像、視訊、3D等等。

從2021年下半年開始,大模型被我們定義為一個很重要的投資方向,我們順着這個方向尋找項目。但是,我們也遇到了很大的挑戰:真正投入做大模型的比如IDEA研究院、華為、百度,是我們投資不進去的;而市場上又找不到能做大模型的團隊,是以有勁兒沒處使。

騰訊科技:但你們去年就投資了深言科技,當時你們是通過什麼方法找到他們的?

王晟:英諾在清華大學計算機系設立了一個獎學金,2021年豈凡超拿了這項獎學金的第一名,我們也開始關注到他們團隊做的事情,正好符合我們想要的項目的标準,就投資進去了。

2021年在多模态方向,我們接觸過多個文生圖的團隊,但是我們一直沒有出手投資,主要是沒看清商業化的轉換路徑。在文生圖領域,我們非常關注可控性問題:

首先,模型能不能被很好地控制?包括一些精确的布局控制,比如我想要生成一張圖,需要中間有一張桌子,旁邊站着一個人,以及很多主體的排布和控制等,模型能不能精準地實作和控制需求非常關鍵;

其次,模型的持續性很重要,它又叫做“概念定義”,比如第一次要求機器畫出鋼鐵俠,第二次還是要畫鋼鐵俠,機器能不能把“鋼鐵俠”的概念定義出來很關鍵,還有二次創作(Inpainting)的問題,比如第一次畫的不盡如意,還需要基礎上修改一下。

在那段時間,我們看了很多項目,但他們也很難解決這兩個問題。

到2023年2月,這幾個問題都被ControlNet解決了,它的出現是裡程碑式的子產品,整個文生圖的可控性被大大提高。

騰訊科技:ControlNet出現确實大大提升整個文生圖領域的生産力,但國内的項目怎麼和Midhourney這些進入中國的明星工具競争?

王晟:對,我們确實又面臨下一個問題:能不能投?怎麼去投?Midjourney的競争力很強,Stable Diffusion開源又免費。此外,很多創業者可能也沒有勇氣做這個方向了,很多項目無非是拿Stable Diffusion結合某個行業做個工具鍊,很少有人會訓練一個通用的文生圖模型。即便有的項目做,他們的估值太高,不适合早期機構投資。

騰訊科技:大模型比較貴,估值也很高,是以也有一些投資人看一些有稀缺資料的垂直模型,你認為這個細分賽道有哪些場景和機會?

王晟:很多人強調大模型拿到的是通用知識,它沒有私有資料,但我認為這完全不重要。

第一,垂直模型拿到的知識,大模型都能拿到,沒有多少東西是某個個體純碎私有、别人沒有的,無非是大家解決問題的先後順序不同。

第二,大模型擁有了足夠知識後,很多細小的知識都不被需要了,Open AI内部人曾經提過,他們在訓練GPT-4的時候,特意留下很多空白的知識域(Knowledge Domain),但在測驗的時候發現即便是沒有被投喂資料的領域的知識,GPT-4也能知道。人類的知識相關性太強了,GPT-4完全不需要資料投喂也能學會這些知識,是以指望那點稀有資料形成核心競争力比較難。

騰訊科技:垂直模型不值得投入,那麼大模型應該怎麼投?這一輪的大模型蛋糕是不是已經被分完了?如果現在想要入場,AIGC領域還有哪些投資和創業機會?

王晟:任何一個新的産業技術範式誕生之後,都會存在一個發展周期,比如“iPhone時刻”的到來有很多技術積累,晶片的內建度和算力、觸摸屏、4G/5G通信等。

iPhone第一天出現的時候,使用者也很難了解它到底能做多少事,是以2007年iPhone出現,但2011年微信才出現,2012年才有了滴滴,2015年才有了拼多多,2016年才出現抖音。從2007年到2016年,中間整整隔了10年。

現在“AI時刻”也要到來了,它代表了一種新的技術範式,但它在初期階段能做的事情并不多。消費者的使用門檻高、基礎設施不夠完善、使用者對它的了解也差很多。可能技術範式的創新會讓AI Infra先起步,比如晶片的成本變得更低、開發工具更完善、終端保有量足夠多的時候,AI會迸發出更多的機會點。

在AI發展的第一個階段,由于大家的想象力還很有限,能做的事情可能是把舊的行業全移植一遍。

騰訊科技:但光依靠“移植”或“遷移”,現有移動網際網路的各細分行業的格局很難被改變。

王晟:在移動網際網路的創新湧現之前,各行業也都是原先業務的“大家夥”做一個遷移、換個流量入口而已。在AI時代也是,先是底層的Infra完善、工具鍊完善、開發環境完善,然後湧現創業者,再做業務移植。

其實,如果隻依靠移植,這個時代不會産生什麼真正的投資或創業機會,隻有等“移植”階段過去,才會真正進入到模式創新的時代,它創造了新的使用者需求,但這是我們還看不到的東西,還需要時間、需要未來的創業者去創造。

當這個周期過去,就會進入到“内卷”階段,就像移動網際網路發展到2017年就已經進入尾聲了,它很難産生真正的創新,也不會有新的商業模式出現了,大家都去卷内容,比如卷短視訊、卷直播、卷帶貨。

我們現在處于AI Infra時代,處于傳統業務逐漸遷移到AI的過程中,在這個時代可能沒有太好的投資标的,這3年我們會繼續投資基礎設施。當然,基礎設施投資是一個長期的過程,但最重要的視窗是在當下這個時代,後面的投資視窗可能會遷移到比如商業模式創新的闆塊了。

騰訊科技:除了AI Infra,在模型層以及應用層你們打算怎麼布局?

王晟:在AI Infra闆塊,硬體上我們投無損網絡、高速度光通信,包括存算一體、Chiplet等,我們也投資了光晶片和量子方向。近期,我們剛投資了一家AI Chiplet供應商“原粒半導體”,它可以通過提高能效、降低成本的方式為多模态大模型提供算力支援。

再更上一層,我們也在關注 MLOps、AI開發架構、AI編譯器等方向。

英諾合夥人王晟:近3年重點投AIGC基礎設施,應用端沒有太好的标的

再往上的大模型層面,我們除了會看語言大模型,也看多模态的大模型和垂類知識域的機會:

英諾合夥人王晟:近3年重點投AIGC基礎設施,應用端沒有太好的标的

在語言大模型闆塊我們投資了深言科技;

在多模态闆塊,我們投資了3D掃描重建技術企業KIRI Innovation(麒砺創新),目前他們在做3D的人工智能的生成式模型,直接text to 3D;我們還投資了做虛拟人動作行為的大模型中科深智,屬于text to motion,它是端到端生成式AI虛拟人技術的公司,能有效改進遊戲角色過于依賴動作庫和表情庫的現狀,依賴“庫”的模式會導緻角色表現力欠缺變化、顯得僵化的問題。

CV領域過去有非常多的小模型公司,4月份我們看到Meta的SAM模型展現出非常強的泛化能力,我們也在觀察真正的CV大模型的投資機會。

圖像、視訊生成領域,由于SD開源、MJ和Runway都非常強大,我們看到的情況是國内大量的創業者在基于SD做應用,而不是自研模型和這幾家硬剛。我們非常期待國内出現有勇氣、有實力的創業團隊。

大模型的另外一個投資方向是AI for Science,這是一個比較早期且富有争議的領域,創業和投資的認知門檻非常高。

英諾合夥人王晟:近3年重點投AIGC基礎設施,應用端沒有太好的标的

AI for Science闆塊分三個範式:科學計算大模型、垂類域知識大模型和垂類域生成式AI。

其中,科學計算是最底層的範式,它可以利用AI幫助科學家做計算,從邏輯上看它能解決一切科研問題,但主要是微軟和DeepMind在做,創業公司可能沒什麼機會。比如我們要設計一個大飛機,需要很多空氣動力學上的研究,目前都是需要依靠極其頂級的科學家來設計和求解、論證。如果AI來做這件事情,它就能解決很多問題,包括航空航天、軍艦甚至建築和半導體設計。

第二個範式是垂類領域知識大模型,這也是我們目前最關注、馬上會做投資的範式,它以LLM大語言模型為底座,加上大量的科學Paper和相關實驗資料進行訓練,期望以此湧現出類似ChatGPT和GPT-4的思維鍊和推理能力,甚至具備一定程度的theory of mind(心智)能力。

第三個範式是垂類域生成式AI,相比較于前兩個範式,盡管它跑得更早一些,但其發展程度并沒有比前兩個範式更成熟,它通過學習大量關于分子結構知識和資料,來實作對DNA結構、分子結構的推測,同時做一些分子之間的力的分析和推測。它可以應用于制藥、蛋白質合成,尤其在大分子生物相關的應用上的機會更多。但它面臨的争議也比較大,盡管它所展現出的效率較高,能比人更快地推測出新結構,但沒有經過實驗證明其有效性。

不論是哪個範式,AI for Science從理論上來說可以解決一切科學領域的問題,比如和人類生活息息相關的可再生能源問題、氣候問題等,但整個AI for Science最重要的應用方向有兩個:醫療制藥和材料領域,因為這兩個領域的賺錢能力最強。

騰訊科技:這些方向還是聚焦在模型層面,但現階段大家其實更關心應用層面的機會,英諾從2020年就觀察AIGC的機會,現階段應用層有哪些想象力?

王晟:在應用方面非常難投。

我們不太想假設這件事,我認為現在還沒有到應用創新的階段,沒有人能假設全新的場景,隻有創業者做出來了,投資人才能看到,我們需要等待。

英諾合夥人王晟:近3年重點投AIGC基礎設施,應用端沒有太好的标的

AI對傳統行業改造其實也不是創業者的“菜”,就算有人能做,這個人肯定在傳統領域極其有影響力,或者說特别懂這個行業、有非常強的資源,這些可能是非常特殊的領域。在其它領域,比如辦公場景,比如做智能PPT,隻能微軟去做;做智能家居、建築設計,隻能AutoDesk去做,對創業者而言這些沒有太大意義。

英諾合夥人王晟:近3年重點投AIGC基礎設施,應用端沒有太好的标的

騰訊科技:即便對很多試圖用AI改造傳統行業的公司而言,内部還需要打通各種資料,也是一個非常艱難的過程。

王晟:對,非常難,可能需要很大的耐心去等待。

騰訊科技:你曾說AI3.0時代是“具身智能”的時代,可以用大模型驅動人形機器人,而自動駕駛和人形機器人的很多能力都是打通的,你認為大模型+自動駕駛算不算一個接地氣的應用層面的機會?

王晟:大模型+自動駕駛面臨的挑戰非常大,我覺得最大的問題是它對錯誤的容忍度太低。ChatGPT胡說幾句話無所謂,但用在自動駕駛上,哪怕是百分之一或萬分一的錯誤,都可能會出現很大的安全問題。

我們可能沒辦法說這次AI的突破一定能使自動駕駛落地,但将智能座艙引入大模型肯定能提升使用者體驗,當然也會增加使用者使用車的成本。

此外,我覺得會對整個自動駕駛産業有比較大的帶動,比如在車裡的算力要給到多少才夠?這些算力由英偉達提供,還是由專門的車規級AI推理晶片來提供?

騰訊科技:這本質上是不是因為大模型擅長解決公共屬性的問題,但很難解決自動駕駛一些很特殊的corner case(邊角場景)?

王晟:大模型也許不一定能有效識别這些corner case,但是大模型的智能水準會大幅度上升,即便它無法識别也可能有辦法處理。比如,我們在路上駕駛撞到了一個你從來沒見過的物體,人類駕駛員是知道如何處理這些情況的,大模型即便無法識别,但它有較高的智能水準,也許也能處理這些情況。

騰訊科技:如果一直堅持訓練大模型識别各種各樣的corner case,也許它能無限逼近人類駕駛員的智力和識别水準?

王晟:對,我們不要低估未來,可能是我一個科技樂觀主義,我相信技術進步能解決很多問題。很多人比較容易高估短期趨勢,大幅度低估長期趨勢,包括大模型的投資熱潮也一樣,很多公司估值高的投不進去,其實這是對短期高度樂觀,并不理性。

騰訊科技:你曾經說做大模型的清華系創業者裡面,最能打的是王小川和深言科技,他們的壁壘主要存在哪些方面?

王晟:核心還是看團隊,最重要的是團隊的“信仰”,大家都看到了大模型,有的人信AGI,有的人不信。比如Transformer是谷歌做出來的,但是谷歌沒有那麼大的信仰,他們一會兒說Encoder不錯,一會兒說Decoder也不錯,一會兒又做一個encoder+decoder 的 T5出來,但隻有Open AI孤注一擲往GPT方向探索。

我們投資了深言科技後,馬上安排深言做下一輪融資,帶他們見了幾十家機構,但沒有一家肯投。後來拉着紅杉的投資人和豈凡超一起吃了一頓牛肉火鍋,吃完後紅杉就答應投資。現在,又有太多投資機構想要擠進去,是以信和不信造成的結果差異還是很大的。

包括現在投資AI for Science也需要信仰,沒有人确定AI能不能湧現出科研能力,我們也判斷不了AI能在什麼時間點、湧現出多大能力、解決多大問題,但我們“信”就行了。我們跟很多科學家都聊過AI for Science,有的科學家很興奮,有的認為啥也不是,在這種情況下即便你懂,也無從判斷。

關于誰能把這件事情做成,也要看投資人自己信不信,我們可以找很多理由,比如說做成大模型需要過去有經驗,因為這裡面要面臨的挑戰有很多,比如資料、工程化、算法、分布式訓練等等,在這方面深言科技是有很大優勢的。

如果認為做成大模型需要具備很強的融資能力,那麼王慧文可能更好;如果認為科研和科學家更重要,那麼就應該投唐傑老師;如果你認為做工程更重要,那可以投資周伯文。

是以核心還是要看你相信什麼,有時候不是因為你真的相信,隻不過是因為你想讓自己相信。

騰訊科技:是以投誰或者不投誰,可能也要看“氣場”契合與否。

王晟:對,我們去年投了深言科技,今年我們也把市場上相關的項目也談了一遍,談完之後反而強化了我們持續不斷加持深言科技的信心。因為過去投資了深言科技,你會很清楚他們的能力在哪裡,會強化你的信仰。

但是對于新入場的人來說,他們沒有站隊,就會覺得企業家更重要,可能去投資王慧文或王小川。總的來說,這沒有核心的标準,每家都有自己的理由。

騰訊科技:你和王小川、王慧文都聊過嗎,為什麼沒有投資他們?

王晟:主要是他們太貴了,對早期基金來說,5億美金或10億美金的投資額太貴了。

騰訊科技:英諾有幾個投資人看AIGC領域?

王晟:我們有一個AIGC小組,組裡就3個投資人,但我們要求每個賽道的投資人都要了解AI,因為AI會改變所有行業。不論你看的是材料方向,還是生命科技,或是晶片、半導體方向,所有人都要把AI思考進去。

騰訊科技:你們什麼時候設立這個小組的?

王晟:前年(2021年),這個小組主要由我來負責。

騰訊科技:這個小組的運轉方式是怎樣的?

王晟:我們不強調KPI,主要靠大家的自驅力,投資人們基本都在沒日沒夜地看項目,我們對投資人的要求是,首先要熱愛這個行業;其次要專業,這樣才能找到好項目;第三就要看投資成績,短期來看,如果投資到好的項目,項目增長很快,投資人也有很大的滿足感,長期來看,好項目最終産生的收益也會給大家一個很好的配置設定激勵機制。

騰訊科技:你們的AIGC小組現在投資了多少個項目?單筆投資大約是什麼樣的體量?

王晟:在這一波大模型和生成式AI投資中,英諾算是接觸項目數量最多和品質最高的機構之一,但真正的好項目非常稀缺,我們投資的數量一隻手就能數過來。投資數量的多少,也和各家基金的政策不同有關系。

我們希望每一個項目都投得精準,比如有的項目我們都看過,我們沒投,但是紅杉資本投了。不是我們比他們更嚴格,而是他們的基金體量更大,有種子、VC、成長,甚至有二級市場業務闆塊,他們更怕“錯過”,我們更怕“投錯”,可能我們也會是以錯過一些項目。

我們有兩類基金,一類是面向過去傳統的天使類型的投資,單筆大概會投資一千萬,現在也有一些早期項目變得很貴,是以我們又做了一個體量更大的基金,單筆投資兩三千萬左右。