天天看點

深度解讀:中vs美 AIGC生态格局對比

作者:ChatGPT掃地僧

當矽谷的投資者和創始人對生成式人工智能産生興奮時,同樣的生成式人工智能熱潮也席卷了中國的投資者和創始人。關于ChatGPT、DALLE-2和Stable Diffusion的消息幾乎同時傳遍了西方科技界,也迅速傳到了北京。

但在西方鮮為人知的是,中國正在建立自己的生成式人工智能平行宇宙。中國的科技巨頭正在建構與OpenAI的ChatGPT和DeepMind的AlphaFold相同的模型,而中國的初創企業界也對這一新技術所帶來的巨大機遇有所察覺。

盡管美國的科技人士通常對矽谷以外的事物視而不見,但政治評論家迅速宣稱中國在實施人工智能方面“超過了美國”,并且美中之間将出現新興的“生成式人工智能競賽”。

那麼,中國的生成式人工智能格局究竟發生了什麼?它對世界其他地區有何意義?

生成式人工智能的炒作和焦慮ChatGPT釋出僅一周後,中國的科技界就充斥着關于這個新聊天機器人的新聞。科學家們開始讨論人工智能何時能通過圖靈測試,科技界開始思考ChatGPT是否能挑戰谷歌,而投資者則對生成式人工智能成為下一個價值數萬億美元的商業領域充滿期待。

半年前,在2022年度百度世界論壇上,百度的創始人兼CEO李彥宏提出了一個新的市場概念:“AI生成内容”(AIGC)。他在主題演講中強調,在未來十年,“AIGC将颠覆目前所有的内容生産模式”。他相信AIGC有潛力将原始内容生産成本降低到目前的十分之一,并将生産速度提高數百倍甚至數千倍。

然而,西方實驗室釋出強大的人工智能模型也引發了中國科技界的警鐘。針對OpenAI釋出ChatGPT的情況,中國的觀察家表達了對中國被西方科技進步“甩在後頭”的擔憂。這些API由少數西方公司控制,更加加劇了中國新興初創企業的焦慮感。

中國的人工智能模型盡管ChatGPT和Stable Diffusion風靡全球,中國實驗室釋出的生成式人工智能模型卻受到了較少的關注。然而,中國的科技巨頭和該國最傑出的人工智能科學家正在不知疲倦地努力建構相同的模型。事實上,中國似乎是除了美英壟斷之外唯一一個開發自己模型基礎設施的國家。

除了谷歌、OpenAI和Meta等生成式人工智能領域的知名參與者外,按模型數量計算,排名前十的開發者中有四家位于中國[1]。其中包括百度、阿裡巴巴等科技巨頭,清華等頂尖大學,以及北京人工智能研究院等政府支援的實驗室。

雖然總部位于以色列的AI21實驗室和加拿大初創公司Cohere也在建構大規模模型,但中國是除了美英之外,唯一具有多個實驗室建構和釋出這些模型的國家。中國還建立了自己的人工智能架構,包括華為的MindSpore和百度的PaddlePaddle。這些架構與主流的西方架構(如PyTorch和TensorFlow)不相容,但有一些轉換工具,如Ivy,可以在這些架構之間進行橋接。

除了模型訓練基礎設施外,中國的開發者在硬體層面也越來越獨立。為應對美國制裁的威脅,中國公司越來越多地轉向國産GPU,如華為的Ascend 910,這有助于訓練像PanGu-α和ERNIE 3.0 Titan這樣的生成式人工智能模型。這些努力為發展一個繁榮的生成式人工智能生态系統奠定了基礎。

深度解讀:中vs美 AIGC生态格局對比

就模型參數數量而言,這是模型性能的一個大緻名額,中國模型大約落後于西方頂尖模型一年左右。與“中國的AI更大、更強、更快”的說法相反,中國在模型規模和性能方面落後于西方。而且,中國很難在短期内超越美國,這主要是因為在頂級人工智能人才方面存在差距。中國實驗室非常擅長借鑒領先的西方實驗室的進展,但在提出原創模型和推動研究邊界方面的能力較弱。是以,中國在生成式人工智能模型領域很可能在相當長的一段時間内保持亞軍地位。

深度解讀:中vs美 AIGC生态格局對比

西方開源模型的釋出也使得中國開發者能夠避免昂貴的開發成本,并快速将現有模型适應中文。在Stable Diffusion釋出幾個月後,中國的研究團隊IDEA-CCNL迅速訓練并釋出了Stable Diffusion的中文版本(名為太乙-Stable Diffusion)。該模型在捕捉中文文化背景方面表現得更好。

深度解讀:中vs美 AIGC生态格局對比

太乙-Stable Diffusion生成的藝術作品:“鐵馬冰河入夢來,立體畫”(出自宋代詩人陸遊之詩)。

深度解讀:中vs美 AIGC生态格局對比

"飛流直下三千尺,油畫"(出自唐代詩人李白之詩)。

中國的生成式人工智能市場圖譜

在應用層面上,中國也落後于矽谷的初創企業生态系統。這再次挑戰了中國人工智能實施領先于美國的說法。如果将我們的中國市場圖譜與之前的矽谷市場圖譜進行比較,你會發現中國還有許多垂直領域尚未開發。例如,在中國,很少有生成式人工智能公司專注于開發者工具和提供編碼輔助。這可能是一個完全被西方公司主導的領域,因為在開發者工具市場上存在較少的文化、語言和政策障礙。

深度解讀:中vs美 AIGC生态格局對比

即使在現有的垂直領域中,中國的參與者數量也較西方少。中國的文本生成、圖像生成和音頻生成初創公司的市場景象需要時間才能成熟到西方的水準,并且可能難以找到足夠大的市場。這是因為大部分西方的文本生成和圖像生成初創公司是面向企業的公司,而中國的B2B市場規模要小得多。

這意味着中國的生成式人工智能領域更像是一個較少競争對手、市場動态快速發展、甚至更多創業公司和投資者機會的藍海。難怪中國的科技巨頭和頂級風險基金都在密切關注中國的生成式人工智能領域。

然而,中國的企業市場發展程度遠不及美國,企業不願意為軟體付費,更習慣于支付服務費用。我們可能會看到中國的人工智能公司建立一種本質上是“服務前端,人工智能軟體後端”的商業模式。這些公司的行為可能與傳統的SaaS公司有很大不同。

深度解讀:中vs美 AIGC生态格局對比

與美國擁有健全的水準化SaaS市場不同,中國的人工智能驅動公司更有優勢深耕細作,為少數幾個大型行業提供服務,而不是廣泛針對SaaS市場。在一些領域,中國領先于美國,包括電子商務、短視訊制作,也可能包括遊戲。事實上,我們已經看到中國的生成式人工智能公司進入了這些領域。比如,AI視訊生成平台Fancy Technology專門面向電子商務企業。

由于文化障礙和政策限制,西方科技初創公司越來越不願進入中國市場。在中國可能會有一個平行的生成式人工智能領域,國内企業互相競争,并相對獨立于矽谷的對手。

相同的技術,不同的垂直領域然而,類似其他領域,簡單的“複制到中國”的模式通常行不通。在西方,基于文本的人工智能寫作和營銷工具是最受歡迎的生成式人工智能公司類型,但在中國這類工具較為罕見。中國企業更小的銷售和營銷預算給商業化帶來了挑戰。高品質的中文語言訓練資料的稀缺成為高性能語言模型發展的瓶頸。視訊營銷的廣泛使用也意味着基于文本内容的應用案例較為狹窄。

相反,中國正在發展自己的生成式人工智能應用垂直領域。就以基于文本内容創作工具為例,許多産品不是專注于銷售和營銷,而是提供通用的學術寫作支援和翻譯服務。受歡迎的AI寫作工具Pitaya專注于提供學術寫作輔助和英文翻譯服務。這是因為中國龐大的學生群體在英語和學術寫作方面經常遇到困難,中國面向全球的公司要求員工與外國同行用英語交流。

此外,一些基于文本的中國産品專注于特定用例,甚至更為狹窄的垂直領域。另一家領先的自然語言處理(NLP)初創公司LangBoat專注于金融文本分析。它能夠幫助中國的金融機構從成千上萬頁的會議記錄、合同和市場報告中快速提取關鍵資料點。盡管中國的通用型人工智能模型仍然略遜于世界領先的模型,但建構具有大量領域資料的垂直專用模型通常彌補了性能差距,并且通常能産生更好的實際應用結果。

在中國,生成式人工智能領域中發展特别迅速的一個領域是AI視訊生成,尤其是數字人和電子商務視訊營銷。與西方的AI頭像和數字人初創公司傾向于強調性能不同,中國公司更加注重其頭像的娛樂價值。隻需将倫敦的AI視訊初創公司Synthesia建立的AI頭像與中國小冰生成的AI員工崔小盼進行比較。Synthesia的頭像看起來像普通的商業人士,而小冰的頭像崔小盼看起來像是一位K-pop偶像。

深度解讀:中vs美 AIGC生态格局對比
深度解讀:中vs美 AIGC生态格局對比

小冰創造的AI員工崔小盼在2021年被房地産公司萬科評選為“年度最佳新員工”。

數字人和AI頭像在中國的媒體、娛樂和電子商務領域也被廣泛應用。一個原因是這些AI頭像具有更高的娛樂價值——它們外觀更出色,并且它們的創作者對媒體和娛樂有更好的了解。是以,消費者更願意接受AI作為浪漫伴侶、電視主持人和TikTok營銷人員的角色。

深度解讀:中vs美 AIGC生态格局對比

中國滑雪選手谷愛淩的AI頭像由數字媒體公司咪咕建立。

另一個原因是中國的電子商務領域更加注重視訊而不是文本或圖像。中國擁有一個龐大的視訊營銷行業,在這個行業中,企業通過直播和短視訊來銷售産品。(請記住,中國是非常受歡迎的短視訊應用TikTok的誕生地)。如果中國的一些AI視訊創業公司能夠突破并在全球範圍内成為主導者,那将不足為奇。

然而,中國的生成式AI創業公司面臨着與西方同行相同的挑戰,包括找尋适用場景的問題以及長期商業化和盈利問題。例如,中國已經有很多AI圖像生成應用程式,但很少有建立可行商業模式的。大多數應用程式更像是玩具,而不是有用的工具,一旦客戶熟悉了這項技術,很可能就會失去他們的注意力。商業化問題在中國投資者對生成式AI未來前景的讨論中經常被提及。

中國創業公司的全球野心談論矽谷創業公司的全球市場計劃是很正常的。但是一提到中國公司的海外擴張往往會引發西方觀察家的警惕。然而,對于中國創業公司來說,海外擴張(或稱為“出海”)是一個自然而然的步驟。随着中國科技行業的發展,越來越多的公司将從一開始就具備全球視野。

這些中國創業公司中的許多進入的是西方公司未涉足的市場。AI語音助手創業公司AI Rudder主要面向東南亞市場,并提供近20種不同的語言和當地方言的産品。公司最初在上海成立,随後在新加坡設立了辦事處,為東南亞市場提供服務。

AI時尚創業公司ZMO.ai也是在中國成立,并獲得了來自頂級中國風險投資基金(如高瓴資本和GGV Ventures)的資金支援。該公司随後在美國和加拿大設立了辦事處,并進入北美市場。該公司為全球時尚品牌建立AI模型。

深度解讀:中vs美 AIGC生态格局對比

ZMO.ai生成的AI模型圖像

一方面,中國的生成式人工智能公司希望拓展全球市場,這是因為在中國進行B2B業務存在挑戰。這在很大程度上是因為中國企業不太願意為軟體付費,因為在中國,人力成本仍然較低。另一方面,具有中國背景的創始人可能會希望保留他們在中國的工程團隊,以利用中國豐富且具有成本效益的工程人才,就像Zoom和位元組跳動所做的一樣。

監管措施即将出台中國政府在監管生成式人工智能方面比其西方對手領先一步。2022年11月,中國國家網際網路資訊辦公室釋出了《關于規範網際網路資訊服務中深度合成内容的規定》,這是一套用于監管合成内容的政策,包括人工智能生成的文本、圖像和視訊。這些規定已于2023年1月生效,其中包括風險評估、實名使用者注冊和标記人工智能生成内容等要求。

然而,随着生成式人工智能産品越來越受歡迎,其他倫理和政策問題可能會出現。目前,人工智能生成的内容處于法律灰色地帶,版權和知識産權歸屬仍不清楚。正如OpenAI的代碼生成模型Codex面臨一位GitHub開發者提起的侵權訴訟,西方和中國的人工智能公司對知識産權的問題變得更加謹慎。中國的人工智能藝術生成初創公司TIAMAT確定其模型訓練所使用的資料沒有知識産權。這一措施也被美國知名藝術生成應用程式Midjourney采用。

那麼美國的制裁呢?對中國的生成式人工智能領域進行分析時,必須考慮到美國加強制裁的影響。2022年9月,美國政府禁止晶片制造商Nvidia和AMD向中國銷售其最先進的圖形處理器(GPU)。許多西方觀察家認為,這一舉動可能嚴重阻礙中國大規模生成式人工智能模型的發展,這些模型通常需要大量計算資源進行訓練。

然而,此類制裁對應用層初創公司的影響相對有限,因為很少有公司使用先進的GPU來訓練和部署他們的人工智能模型。即使是百度等中國科技巨頭的人工智能雲業務也受到的影響較小,它們在業務中很少使用受到制裁的GPU,并且從長遠來看,它們的目标是開發自己的GPU來取代進口産品。Nvidia也已經為中國市場專門推出了符合規定的GPU,以避免制裁影響。

将受到影響的是中國的基礎研究機構,它們依賴先進的GPU來訓練和擴充他們的模型。事實上,絕大多數中國的大規模生成式AI模型都是在Nvidia的GPU上進行訓練的,包括大部分百度開放AI聯盟(BAAI)的無道1.0和無道2.0模型,清華大學的多模态CogView模型,以及百度的大規模語言模型ERNIE 3.0。

最近,拜登政府正在考慮對美國對華出境投資進行新的限制措施。這些限制的影響将取決于其範圍和條件。早在美國政府開始考慮投資控制之前,北京已經對美元基金的投資活動實施了限制。盡管這些基金大多設在中國,但由于它們的資本來源是外國的,它們在中國的深科技領域幾乎被排除在外。美國對對外投資的額外限制将進一步加強美國和中國科技生态系統之間的障礙。

總結思考中國的生成式AI領域正在快速發展,除了矽谷的生成式AI領域外,可能是最令人感興趣的。中國是唯一一個除了美國和英國之外擁有完整的“生成式AI堆棧”的國家,從基礎模型到應用都有涉獵。由于中國市場在許多方面與西方不同,是以中國的生成式AI領域與西方有很大的差異。與此同時,中國的創業者和投資者在生成式AI方面面臨着與西方同行相同的挑戰,即建立可持續的商業模式和将先進技術商業化。中國開發者還面臨着美國制裁和國内政策限制的額外挑戰。

我們仍認為中國處于生成式AI生态系統興起的早期階段。也許與移動時代類似,兩個生态系統中标志性的未來以AI為先的公司将看起來截然不同。在美國,這些公司可能會為傳統企業使用案例提供服務,得益于該國成熟的B2B軟體市場,而在中國,一個擁有龐大電商、供應鍊和消費者行業的國家,我們預計會看到創業者建立競争力強的以AI為先的公司來服務這些市場作為起點。

即使考慮到在基礎研究能力方面的技術滞後以及美中緊張關系不斷增加的壓力,我們預計中國的市場和人才将繼續為中國社會以及其他地區創造令人興奮的公司。