天天看點

如今,Sora已經開始嘗試建構真實世界了……

如今,Sora已經開始嘗試建構真實世界了……

本文作者尹烨,華大集團CEO

在美國當地時間2024年2月15日,OpenAI釋出了Sora。簡單了解就是,可以直接通過人工智能,由文字或者語言直接生成的視訊大模型。OpenAI官方并沒有單純地把它叫做視訊模型,而是稱為“世界模拟器”。也就是說從這一刻,可拟合更多真實實體定律的數字孿生世界走進了人類社會。我願意将其類比為,開啟了AI發展的牛頓時代。

1894年,當北洋水師輸給了日本海軍,清朝的覆滅幾成定局,其主因固然是綜合的戰鬥素質,但就主力艦艇的參數來講,它主要輸在了速度上。日本海軍的主力戰艦,吉野号的航速達到了23節,緻遠艦為18.5節,而定遠、鎮遠二艦僅僅為15節左右。

1945年,日本最大,也是人類史上最大的一級戰列艦大和号,這艘滿載排水量超過了7萬噸的怪獸,僅僅參戰數次就被轟沉。美軍的航空母艦,從空中對其進行了圍剿,這是一種降維打擊,它輸在了Z軸的次元上,而大艦巨炮的戰列艦時代從此也就結束了。

兩年前我的确認為紮克伯格的“元宇宙”忽悠得太早太過了,但一年多前ChatGPT出台以後,我跟很多朋友們對話都認為,這一波AI的機遇是不容錯過的,應當積極擁抱技術變化,加大開放交流。

而就在正月初七的這一天,OpenAI的Sora橫空出世,以Photoshop等設計軟體而聞名于世的Adobe公司可能做夢也沒有想到,股價會是這樣一個走勢。确實,如果一句話就能生成視訊,美工或者視訊剪輯師的前途又在哪裡?正如結束友善面的,是外賣或者預制菜,而不是更好的友善面。

朋友們可以看看這些視訊,在官網上都有。當我看着這一個個真假難辨的demo視訊的時候,我更加清醒地明白了,我們遇到的不是一個周期,而是一個時代。周期還會回歸,科技卻隻會呼嘯而過,一個真正的、可以用真實實體定律孿生的數字世界,已經開始了它的時代。

為什麼在ChatGPT3.5釋出的時候,我們都覺得尚能一戰呢?因為這個時候的競争,主要依然是在語言和文本的一維層面,而Sora的到來,讓我們看到了二維,乃至多元世界的模拟可能性。

雖然此時的Sora仍不完美,其依然是以二維為主的、真實世界模拟的展現。比如我們剛才看到的,這些以假亂真的視訊,你仔細看,它裡面都有很多的瑕疵。比如東京視訊當中的左腿右腿的錯誤,就非常明顯。但此時再去看看它的競品,确實已經是一種石器時代的觀感了。

推特上一位名叫GaborCsellev的部落客,給Sora、Pika、Runway和StableVideo四個模型,輸入了相同的prompt,就是提示語,那麼我簡單地翻譯一下,他輸的提示語是,“美麗而繁華的東京正在下雪,這個鏡頭要穿過繁忙的城市街道,跟随着幾個正在享受着美麗雪景,并且在附近購物的人們,而盛開的櫻花花瓣随風起舞,落英缤紛”。

我們可以看一看,這四個軟體不同的生成效果,雖然漫天飄雪和櫻花盛開,在真實世界當中,幾乎不會同時出現。但這組簡單的效果對比,我們已經足以看到,Sora性能的遙遙領先。

就怕學霸還謙虛,OpenAI在其技術報告當中,毫不掩飾地承認了它的衆多不足,Sora在很多方面還不能契合真實世界的實體特性,但這有什麼關系呢,誰會要求一個幼兒剛學算術,就要求他會懂方程,重要的是,他已經做好了持續學習并應用微積分的準備。

正如牛頓時代的實體建構并不完美,愛因斯坦量子力學在不斷地對其補充,但1687年牛頓的《自然哲學的數學原理》一經問世,人類的科學革命由此高潮疊起。在疫情前的那幾年,人類遇到了科技瓶頸的說法,不絕于耳,似乎我們已經被“智子”鎖死,然而就在這短短四年,無論是生命時空組學技術的突破、mRNA疫苗的突破、可控核聚變的突破、超導材料的突破、量子計算的突破,特别是人工智能的突破,讓我們又一次看到了,人類文明快速演進的可能。

如今,Sora已經開始嘗試建構真實世界了……

在樂觀之餘,我們更要冷靜地反觀自身,這裡面來自中國的原創貢獻有多少?而在“脫鈎斷鍊”的不利大背景下,留給我們的機會和時間,真的足夠嗎?特朗普上台就開始打中美貿易戰,打了幾年發現傷敵一千、自損一千二,拜登雖然不斷地被質疑身體健康有問題,尤其是腦健康問題,但不得不服氣,他跟他的團隊一出手就是王炸,直接打到了要害。

今天的晶片,不再僅僅隻是一種電子元器件、一種商品,它是一種基礎設施的提供者,如果把人類已經存在的語言、圖像、音頻、視訊等這些資料庫看成是人類文明的金礦,但是你已經有挖掘機了,我卻被限制隻能用鐵鍬,長此以往會是什麼樣的結果?

我們在晶片的問題上,可能犯了刻舟求劍的錯誤。比如總有一種聲音,認為我們能夠突破14納米,甚至認為如果我們能追趕到7納米,我們就會赢,但這個前提是我們的競争對手就不進步了,就在原地等着。我并不是說,你追趕到14納米、7納米不重要,而是你要明白,競争對手會在同樣的時間,實作3納米、2納米,甚至1納米。

我們可以在戰略上藐視,但不能不在戰術上重視,科技界、産業界、資本界,更不能揣着糊塗裝明白,而我們在大模型的問題上,則可能陷入了一個概念炒作的資本套路。當下據不完全統計,國内号稱有大模型的公司,已經有300多家,相信大部分還是“多小散亂”,面對GPT在簡體中文的世界裡,似乎尚能一戰,但面對Sora的橫空出世,可有一個能打的,甚至是接近的嗎?

這就比如說在爬山,領先的一直在上面等你,好不容易氣喘籲籲地快接近了,領先者再閑庭信步地,往上慢慢走一段,這就從心理上從體力上,不斷地去消耗和打擊你。

我講這一段不是悲觀,更不是長他人志氣,滅自己威風,我是想說,知道落後不可怕,怕的是知道落後還不承認,那隻會越拉越遠。

1448年,當德國匠人古登堡發明了他的印刷術後,歐洲大量的書籍得以普及,學術思想交流加速,文學作品的範圍擴大,文藝複興開始加速,并逐漸催化出了科學革命。類似的,電報、廣播、電視、網際網路到移動網際網路,大大加速了資訊的對稱,而人工智能則會以史無前例的速度,來促使人類的智力和知識平權。

在碳矽融合的重要關口,我們的科技,特别是我們的教育,又該何去何從?一味地做小鎮做題家,還會有出路和未來嗎?從李約瑟之問,到錢學森之問的尴尬,還要持續多久?這個問題就留給諸君共同考慮。

莊子在《齊物論》中雲:“莊周夢為胡蝶,栩栩然胡蝶也,自喻适志與,不知周也……不知周之夢為胡蝶與,胡蝶之夢為周與?”劉慈欣《三體》當中,最著名的一句莫過于:“實體學不存在了。”Sora的問世,也讓很多業内人士驚呼,“現實不存在了”。那麼,不妨更大膽地想一步,如果我們已經可以模拟真實世界了,又焉知如今的真實世界,不是模拟的?

如今,Sora已經開始嘗試建構真實世界了……

(本文僅代表作者個人觀點)

繼續閱讀