天天看點

375人的小公司,為何能讓微軟、谷歌“栽跟頭”?

與展示在人們面前的龐大潛能不同,ChatGPT背後的OpenAI僅僅隻是一家由375名員工構成的小型企業。

近兩年以來,這家公司在人工智能領域給外界留下了足夠深刻的印象。不久前,OpenAI的首席執行官Sam Altman在Twitter上對自家公司的人才密度表示出了贊許,并且這“并不是在吹牛”。當然,如果用不是那麼抽象的話來概括的話,這種贊許更多指向的是這家擁有微軟背景的“小團隊”正在用其舉世矚目的成果證明着自身的創新能力和對前沿技術的深刻探索。

小團隊,大影響

如我們所見,OpenAI為外界帶來了ChatGPT、GPT-3.5、DALL-E、Codex、MuseNet等一系列的研究成果。而在2021年和2022年,這家人工智能研究實驗室分别釋出了9篇和13篇研究論文。

向心力可能是OpenAI所具備的另一個與衆不同的特質。對這家公司來說,把員工的全部潛力引導至一個共同的目标上并不是一件難事。而這種特質似乎也能追溯到公司的企業文化上——它把團隊合作放在公司的首要位置,不斷影響和培育出一種鼓勵員工在推動人工智能領域前進的道路上勇于創新的工作環境。并且同時,OpenAI的團隊非常強調團隊協作和開放式溝通,使得員工隊伍更加包容多樣。

深入VS淺出

與OpenAI不同的是,另一家深入涉足人工智能領域的公司——谷歌旗下的DeepMind團隊擁有超1000名員工,幾乎是OpenAI的3倍。不過,DeepMind主要以研究為導向,而非OpenAI所追求的讓産品快速實作商業化并從中盈利。而基于這一點,在過去的三年中,DeepMind發表的研究論文數量幾乎是OpenAI的30倍之多,并且更加多樣化。

DeepMind因AlphaGo擊敗世界頂級圍棋選手李世石而為外界所熟知,并且它還通過3D蛋白質預測模型AlphaFold等項目深入到了健康和生命科學領域。但在更實際的角度上來看,DeepMind與普羅大衆的距離卻顯得遙遠了一些。

DeepMind并沒有提供公開的API供一般群體使用。相反,通常情況下,DeepMind隻會與企業群組織建立合作夥伴關系,讓後者得以通過API或者其他方式通路團隊的算法,而這往往隻會用于特定或者限定範圍的使用場景。比如,2019年時,DeepMind宣布與谷歌雲合作,在谷歌雲平台上提供其部分人工智能模型。這些模型以API的方式呈現,并旨在用于醫療健康和生命科學的研究方面。

不過,随着Meta和DeepMind分别推出ESMFold(“宏基因組”資料庫)和AlphaFold,蛋白質折疊領域中長達50年懸而未決的問題也随之得到了解決。

AlphaFold 2和其他替代方案使用多序列比對 (MSA) 和類似蛋白質模闆的方式在原子分辨率結構預測方面破冰。然而,ESMFold是基于語言模型的内部表征作為輸入源,并且僅使用一個序列生成結構預測。但這些突破性模型的問世為一些開發者提供了打造自身作品的機會——MIT的研究人員使用了AlphaFold來觀察現有的計算機模型是否可以掌握抗菌化合物的工作原理。

另一方面,Meta AI也推出了一款名為Galactica的開源語言模型産品(基于大語言模型/LLM),它可以提供論文和百科詞條生成、回答問題、完成化學公式和蛋白質序列的多模态任務等一系列功能。不幸的是,由于安全和準确性問題,它在三個月後被迫關停。Meta AI負責人Yann LeCun表示,在作為寫作助手的層面上,LLMs是可以信賴的。但如果有人把它當作搜尋引擎進行查疑解惑時,它就沒那麼可靠了——它的強化學習能力隻是減輕了一些錯誤,卻沒有解決其中的問題。

OpenAI栽樹,初創公司乘涼

對谷歌和Meta來說,至少有一點可以肯定的是,這兩家巨頭一直是開源社群的熱心貢獻者。他們在幫助數千家基于其研究和技術成果的科技初創公司的建立方面發揮了重要作用——OpenAI的當紅頭牌聊天機器人ChatGPT 仍然基于Transformer模型,而該模型的源頭為谷歌在2017年發表的論文《Attention is all you need》。

創作出一篇具有高度影響力的研究論文是尋求創新和驗證創新之間的一種微妙平衡。它不僅需要提一個新穎的想法,還需要有能力通過嚴格的實驗、面對無數次的失敗、以證明其有效性。相比之下,一個成功産品的出現多數會取決于技術的熟練程度和市場的相關性,這種出現對産品與市場之間的契合性的需求要先于技術的創新。

憑借ChatGPT和其他産品,OpenAI在駕馭産品開發的複雜問題上取得了顯著收獲。但OpenAI也被一些人看作是一家對開源模式并不友好的企業——它以商業化的方式來為其API牟利,這包括為自身API的建立來付費使用系統。作為結果,開發者必須購買相應的代币才能使用該API。

值得一提的是,許多員工也選擇了離開OpenAI,去建立自己的公司。在這一點上,Anthropic是一個相當典型的案例。這家由OpenAI的前員工Dario Amode作為聯合創始人共同創立的公司最近剛獲得了超過7億美元的投資。它開發了一個名為Claude的人工智能系統,這與OpenAI的ChatGPT多少有些相似,但也在一些重要方面也呈現出了與後者不同的地方。

這類後繼者的名單上還包括Pilot、Covariant、Adept、Living Carbon、Quill(被Twitter收購)、Daedalus等一系列新面孔。要知道,在過去的5年裡,有近30名員工離開了OpenAI,并在随後創立了人工智能企業——當然,這些人也可以稱作是“OpenAI的栽樹乘涼者”。

他們中的絕大多數曾屬于OpenAI的中進階上司職位。但也有一些是新人。2021年,OpenAI的一名前研究實習生Anish Athalye創辦了Cleanlab,這是一個以資料為中心的人工智能平台,可以自動發現和修複機器學習資料集中的錯誤。OpenAI的另一位前研究工程師Taehoon Kim則于最近創立了Symbiote AI,而這是一個實時的3D人偶生成平台。

當然,除此之外,OpenAI自身也設立了一支創業基金,以便在早期階段發現相應的人才,并在他們的旅程中提供相應的幫助。

相生、相伴、背道而行

在産品落地方面,OpenAI毋庸置疑地處于了這一領域中的前列,超過同時代的DeepMind和Meta AI。但在更高的層面上看,後兩位在研究領域的貢獻更大,并催生出了包括OpenAI在内的一系列衍生公司。

在人工智能的世界中,合作是一種至關重要的選項。而這一點也為微軟和OpenAI所認知,二者都使用了PyTorch(Meta的開源Python機器學習庫),而PyTorch又使用了OpenAI的Triton(OpenAI的開源程式設計語言)。

不過,也如我們所見,盡管開放科學存在着潛在的好處,并且協作的方式也正在被一些人工智能大咖所看好,OpenAI分享自身算法的方法卻着實存在着一定的門檻。Sam Altman對人工智能實驗室之間協作相處的事情上秉持了質疑的态度,而OpenAI也在限制或禁止外界通路其算法,并以API的形式将它們提供給公衆。

也或許,在為外界所日益在乎的人工智能領域,OpenAI已經找到了自身的“不在乎”。

繼續閱讀