天天看點

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

克雷西 魚羊 發自 凹非寺

量子位 | 公衆号 QbitAI

現在世界上最受關注的技術團隊是哪一支?

Sora團隊,已經來到聚光燈中心。

不僅項目負責人評論區被擠爆,成了X最火“景點”。

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

天才成員們的履曆,也正在持續引爆關注。

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

△來自微網誌部落客@木遙

大家夥發現,這支團隊挺年輕:兩位負責人都是在去年(2023年)剛剛博士畢業,團隊裡甚至還有00後選手……

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

但牛啤也是真的牛:

Tim Brooks,DALL-E 3作者之一,GitHub 5.7k星項目InstructPix2Pix作者,2021-2022年在英偉達實習時,就是視訊生成研究的項目負責人。

William (Bill) Peebles,和謝賽甯合作,搞出了Sora的技術基礎之一DiT(擴散Transformer)。論文還曾入圍CVPR 2022最佳論文候選。

……

這支團隊到底什麼來頭,咱們今天一起仔細聊聊。

應屆博士帶隊

包括Tim和Bill在内,Sora的主要負責人一共有三名(以下排名不分先後)。

Tim Brooks,也是DALL-E 3的作者,去年1月剛從加州大學伯克利分校博士畢業。

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

Tim大學就讀于卡内基梅隆大學,主修邏輯與計算,輔修計算機科學,其間在Facebook軟體工程部門實習了四個月。

2017年,大學畢業的Tim先到Google工作了近兩年,在Pixel手機部門中研究AI相機,之後到了伯克利AI實驗室攻讀博士。

在伯克利讀博期間,Tim的主要研究方向就是圖檔與視訊生成,他還在英偉達實習并主導了一項關于視訊生成的研究。

回到校園後,Tim與導師Alexei Efros教授和同組博士後Aleksander Holynski(現在谷歌)一起研制了AI圖檔編輯工具InstructPix2Pix,并入選CVPR 2023 Highlight。

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

去年一月,Tim順利畢業并取得了博士學位,轉而加入OpenAI,并相繼參與了DALL-E 3和Sora的工作。

值得一提的是,Tim不僅在專業領域擁有高超的技術水準,還是個多才多藝的人。

據Tim自己介紹,他還喜歡攝影和音樂,高中時他拍攝的照片獲得過National Geographic頒發的獎項,本人到過百老彙演出,還獲得過B-box國際獎項……

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

而與Tim師出同門、晚畢業4個月的William Peebles,也是Sora的另一名負責人。

(Peebles在X上用昵稱Bill,在Linkedin上及論文署名時用大名William,下文一律用Bill指代。)

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

Bill大學就讀于MIT,主修計算機科學,參加了GAN和text2video的研究,還在英偉達深度學習與自動駕駛團隊實習,研究計算機視覺。

畢業後正式開始讀博之前,他還參加了Adobe的暑期實習,研究的依然是GAN,該項目和(時任)卡内基梅隆大學華人學者朱俊彥(也是Efros教授學生,現在在MIT)組有合作,并成為CVPR 2022最佳論文候選。

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

之後,學期開始,Bill到了伯克利Efros教授課題組攻讀博士,研究成果多次入選SIGGRAPH、ICCV、CVPR等學術會議。

2022年5月,Bill到Meta進行了為期半年的實習,和謝賽甯(Bill開始實習時還未離開Meta)合作發表了DiT模型,首次将Transformer與擴散模型結合到了一起。

該成果被ICCV 2023錄用為Oral論文。值得一提的是,OpenAI此次釋出的Sora,被認為正是基于DiT建構的。

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

去年5月,Bill也從伯克利畢業,并入職OpenAI。

除了這兩位去年加入的研究者,Sora團隊的另一位負責人Aditya Ramesh則是OpenAI的“老人”。

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

Aditya是DALL-E的創造者,主導了三代DALL-E的研究,三個版本的論文當中他都是共同一作。

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

而這樣一位主導三代DALL-E,如今又上司Sora團隊的大神,卻隻有大學學曆。

據LeCun介紹,Aditya大學就讀于紐約大學,并在他的實驗室參與過一些項目。

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

其間,Aditya就已經在研究所學生成式模型,并和LeCun共同發表論文。

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

畢業之後,Aditya本想繼續深造,但在OpenAI的暑期實習中被留了下來,成為了正式研究人員。

00後已加入

Sora團隊的大學生,還不止Aditya Ramesh一位。

前文提到,這支團隊中有一位“00後”Will DePue,就是2022年才剛從密西根大學計算機系大學畢業的。

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

這位小哥大四的時候創業搞了個市場咨詢公司DeepResearch,這家公司後來被Commsor收購。

2023年7月,小哥加入OpenAI。根據他的領英資訊,他是在今年1月才剛剛加入Sora項目組的。

另外,David Schnurr和Joe Taylor也都沒有博士學位。前者畢業于加州大學聖塔芭芭拉分校,後者畢業于美國舊金山藝術大學。

而正如Aditya Ramesh自己所說,Sora團隊的不少成員都是DALL-E 3的作者。

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

包括兩位華人Li Jing和Yufei Guo。

Li Jing是DALL-E 3的共同一作,2014年大學畢業于北京大學實體系,2019年獲得MIT實體學博士學位。在Meta做了2年多博士後之後,Li Jing于2022年加入OpenAI。

華人作者中還有Ricky Wang,今年一月剛剛從Meta/Instagram跳槽到OpenAI,另外兩位Yufei Guo、Clarence Ng沒有太多公開資料。

新跳槽來的還有Conner Holmes,他在微軟工作時以外援形式參與了DALL·E 3的推理優化工作,後來幹脆加入OpenAI了。

最後,來看一眼完整作者名單:

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

從團隊的組建情況和研究基礎來看,Sora應該是OpenAI近半年來的最新成果,而非網傳“早已有之但憋着不發”。

不過,Sora炸場,頂級人才又持續星聚,還是驚得衆人開始重新考量OpenAI的技術領先性。

就在今天,作者釋出的Sora新作,連“同一場景”下的多機位視訊都整出來了。

網友們的心情be like:

Sora背後團隊:應屆博士帶隊,00後入列,還專門招了藝術生

現在,是視訊生成,下一個又會是什麼?

參考連結:

[1]https://www.wpeebles.com/

[2]https://www.timothybrooks.com/about/

[3]http://adityaramesh.com/about.html

繼續閱讀