前言
瑞士,有着覆寫國土面積 60% 的阿爾卑斯山脈和超過 1,500 個湖泊,瑪麗·雪萊所著的西方文學史上首部科幻小說
《弗蘭肯斯坦》就誕生于日内瓦湖畔,它講述了一位天才科學家從零到一創造出智能生命體的故事,成為此後 200 年間讨論人類與機器、生命與智能的哲學模闆。
Demiurge Technologies 也是一家希望從生命中獲得線索并以此來開發通用人工智能的創業公司,位于瑞士一個依山傍湖的小鎮——靜谧但充滿力量。
公司的辦公地點高度保密,從不接受無關訪客,即便是新員工面試也會先安排在其他地方,在正式錄用後才會被邀請來公司。
「公司的實體空間是精心打造的文化載體,我們利用環境甄别對的人,依靠對的人進一步強化環境的凝聚力。」Demiurge 聯合創始人兼 CEO 劉思宜(Idonae Lovetrue)表示。從這個看似有些神秘的規定中足以看出一種他們對實作通用智能所需人才和文化的獨到視角及判斷标準,令人心生敬畏,以至于在去公司的路上我忍不住問她「我要不要帶個頭套?」
公司院落的曆史要遠遠超過人工智能的曆史,除了 Xbox 等科技公司裡常見的娛樂裝置之外,他們的員工還有一項令人羨慕的放松方式——經過後院一個 100 英尺長的木碼頭去湖裡劃船,Idonae 說:「我們鼓勵大家在湖中思考和放松。這裡如同梭羅筆下的瓦爾登湖,我們切身感悟親近自然,必然會汲取沉靜的力量,發現更本質的自然規律。」
Demiurge 可能擁有全世界最美的辦公地點,像極了托爾金筆下描繪的霍比特人的家園。Idonae 堅定的認為「我們就是一群霍比特人,以無畏嚴謹的腳步去追逐夢想(實作通用人工智能)。」
基于生物神經元的下一代深度學習
「雖然目前的深度學習在語音識别和圖像識别方面取得了突破性進步,但如果把深度學習用于絕大多數的其他領域,比如說自動駕駛、實體機器人等,就會面臨一個來自于真實世界的非常大的挑戰,那就是訓練資料量嚴重不足。」Demiurge 聯合創始人、CTO 任志攀(Bragi Lovetrue)表示。

人工智能不同應用場景的資料需求和資料供給對比,圖檔來源 Demiurge Technologies
拿開發消費級别的全自動駕駛來說,最大挑戰在于要開發出在交通事故的預判和預防上遠超人類駕駛員的軟體。
如果用現有的深度學習去實作這一點,那就需要大量的事故資料,但這方面的資料供給非常有限,而采集資料又難度很大。首先,沒有人能夠準确預測何時何地會發生何種事故,是以無法系統地提前部署以采集真實事故資料;其次,從法律上來說我們不能靠人為制造事故來采集資料;第三,也無法模拟資料,因為事故更多涉及實時的傳感以及與實體世界的互動,模拟出來的資料與真實資料差距很大,這從
DARPA 機器人挑戰賽就能看出來;最後,像
AlphaGo那樣,在規則定義明确的簡單環境下自行創造大量訓練資料的方式,在複雜的真實環境中難以發揮作用。
如果遇到資料量不足的情況,同時又很難通過之前那些行之有效的方式去增加資料供給,那就無法發揮出深度學習的優勢。而更重要的是,我們還會遇到資料類型不一樣的問題,實體世界中是不同傳感器擷取的實時資料流,而現在深度學習在資訊世界中的應用,比如說圖像識别,使用的資料都是基于圖檔的資料點,而非資料流,是以這也是将深度學習現有的成功延伸到真實實體世界應用的一個底層障礙。
基于這個原因,Demiurge 專注于開發一種系統方法從源頭解決真實世界諸多領域中資料量嚴重不足的問題——既然很難有效增加資料供給,為何不設法大幅降低對資料的需求?
降低對資料量的需求、實作小樣本學習甚至 one-shot learning,是目前深度學習研究中的關鍵問題,
Yann LeCun、
Yoshua Bengio等深度學習專家也多次在演講中提到解決深度學習中 one-shot learning 問題的重要性。
在今年斯德哥爾摩的全球機器人頂級學術會議 ICRA 上,Bragi 在 Industry Forum 演講中介紹了 Demiurge 的方法,從神經科學裡尋找關鍵線索,「比起深度學習的點神經元,生物神經元所擅長的是從多模的實時資料流中提取多元度的時空資訊來實作 one-shot learning,這是現有的深度學習很難做到的。生物神經元不僅能夠做這種特征提取,而且是以一種非常高效的方式,效果和效率都很出色。」
深度神經網絡的确從神經科學領域的研究中擷取了一些靈感,但其工作原理與人腦截然不同(誠然,我們對大腦的工作原理還沒有弄清楚),Yann LeCun 表示,他最不喜歡的對深度學習的定義就是「它像我們的大腦」,谷歌
Jeff Dean認為深度神經網絡是對大腦神經網絡的簡單抽象,并非是模拟人類神經元如何工作。神經科學專注的點包括計算的細節實作,還有對神經編碼以及神經回路的研究。然而,在機器學習領域,人工神經網絡則傾向于避免出現這些,而是往往使用簡單和相對統一的初始結構,以支援成本函數(cost funcion)的蠻力最優化。
Bragi 從曆史的角度分析了深度學習和神經科學的關系,「現在的深度學習從神經科學中獲得的靈感非常有限,這是因為深度學習的理論基礎是上世紀 80 年代基本定型的,那時之前的神經科學也發展比較慢,無法為深度學習提供更多靈感。而從 80 年代至今,神經科學的發展速度遠遠超過了之前,過去 30 年産生的神經科學知識是 80 年代以前的 46 倍,而且現在每年神經科學獲得新發現的速度是 80 年代以前的 100 倍。是以,對于深度學習來說,如今的神經科學已經是一個非常巨大的寶庫,為提升現有深度學習的學習能力提供重要線索。」
Bragi 表示,越來越多的深度學習專家開始研究如何從神經科學中擷取更多的線索,「 Yoshua Bengio 做的非常前沿,一方面研究深度學習的反向傳播算法在生物神經元上是如何實作的,另一方面研究所學生物神經元的 STDP 學習算法如何提升現有的深度神經網絡的學習能力 。位于深度學習與神經科學交彙的最前沿,我們很深刻地體會到現在正在發生着的轉型,從深度學習和神經科學沒有太大關系的這一代(深度學習1.0),過度到深度學習重新從神經科學獲得重要啟發的下一代(深度學習 2.0 )。」
深度學習 2.0 ,圖檔由來源 Demiurge Technologies
在近期谷歌 DeepMind 和 MIT 媒體實驗室的合著論文
《Towards an integration of deep learning and neuroscience》中提到,近期出現的結構化、成本函數和訓練程度的複雜化這兩項機器學習方面的進展或許會将神經科學和機器學習兩個研究領域看似不同的視角連接配接起來。此外,硬體方面,IBM Zurich 在 8 月首次用低成本高性能的相變材料實作了生物神經元計算的關鍵機制——
神經薄膜。
更重要的是,面向實體世界的移動人工智能的各種應用需求(識别、避障、抓取等),與各類生物在實體環境的各種生存需求是高度吻合的。Bragi 表示,斯坦福大學人工智能實驗室主任李飛飛教授就特别重視深度學習在機器人上的應用。
生物神經元,經過上億年的演化,是自然找到的最優解決方案。對于 Demiurge 來說,了解生物神經元的計算模型是找到降低資料需求的通用算法,開發通用移動人工智能核心技術的關鍵。
這與其他解決資料量不足的思路有着本質不同。「比如說 UC Berkely 的
Pieter Abbeel和 Google 的 Sergey Levine ,他們都是在用深度強化學習來開發基于自我監督學習(self-supervised learning)的通用算法,但這種自動的資料收集和标記本質上依然是增加資料供給。此外,NYU 的
Brenden Lake等用貝葉斯程式學習的方法針對特定問題開發出專門的數學模型。雖然能夠在特定任務中大幅降低了資料需求,實作了 one-shot learning , 但這不是通用方法,」Bragi 說,「實際應用中需要的是降低資料需求的通用方法,深度學習的通用性無疑是最佳的。對于深度學習來說,如果不從生物神經元原理入手的話,是很難解決這些問題的。」
Bragi 表示,目前深度神經網絡與生物神經網絡最本質的差別在于神經元的類型。目前深度神經網絡用的是點神經元,其計算模型是把信号權重平均的結果輸入到一個非線性函數。這種點神經元是對生物神經元的極度簡化,沒有基于時間的變量。而生物神經元則利用脈沖進行基于多元時空變量的計算。單個生物神經元的計算模型是神經科學領域的一個關鍵問題,而這個問題的答案正是設計下一代深度學習的關鍵線索。
Demiurge 就是完全專注在這個問題上,所做的結果也走在世界最前沿,「我們已經開發出了生物神經元的計算模型,現在正在非常嚴謹的對它進行測試。 」Bragi 說。
點神經元和脈沖神經元,圖檔來源 Demiurge Technologies
這個模型的關鍵在于了解脈沖如何以非常少量的計算步驟和能耗能夠準确抓取極高次元的時空資訊。
「沒有基于脈沖的計算模型—僅僅像 IBM TrueNorth 那樣,簡單模仿一些生物神經元的硬體特點,或者像 Numenta 和
Vicarious的 HTM(Hierarchical Temporal Memory)那樣,簡單借鑒一些生物神經元的軟體特點—消費級别大腦晶片的硬體開發也就無從談起。 對于實作生物神經元計算模型的軟硬體要求的掌握,是 Demiurge 最重要的核心優勢。」
這種計算模型的提出是多尺度跨領域研發的結果,不僅需要對跨領域的基礎理論和前沿算法進行研究,還要從應用角度來分析真實世界的需求和需要滿足的限制,來縮小算法搜尋的空間。因為真實世界中有很多限制,比如說提供的資料量非常少,但為了應用成功或者讓物種生存,就必須快速學習來了解整個環境,而在整個過程中又不能耗能太多。
生物智能給 Demiurge 提供了非常重要的線索,他們從跨物種的通用智能系統出發,了解要滿足什麼樣的條件才能最大化它們的生存,這是從生存追問的一種智能系統設計的思路。不管設計出何種模型,都要滿足這些限制。
目前深度學習領域從實驗室結果到産品級應用的演化程序,對于真實世界的諸多限制一開始是盡量回避的,即首先選擇那些可以不太涉及實體限制的簡單場景,盡力實作在該場景下深度神經網絡的最優化表現後,再開始逐條考慮開發應用時必須面對的各種實體限制。
「這種演化可能适合學術研究,但不适合産品研發。Demiurge 的研發從一開始就充分考慮真實世界應用的所有限制,開發出來的計算模型和大腦晶片能在真實世界的各種限制條件下完成出色穩定的應用表現。 」Idonae 進一步解釋了這背後的決策依據。
由于采用了同時滿足技術突破和應用表現的雙重評估标準,Demiurge 的研發風格是極為大膽和嚴謹的。提出的計算模型首先要在從數學理論上完整論證,同時還要用神經科學最新的發現和資料去做驗證。這部分數學理論與神經科學的驗證之後, Demiurge 會開始軟體的模拟和硬體的實施,最終把自動駕駛作為首個測試平台,通過實作第四級别的無人駕駛測試他們的大腦晶片産品在對交通事故的學習、預判和預防的表現。
Demiurge 雖然是從神經科學中尋找深度學習突破的密碼,但他們所做的技術依然可以稱之為深度學習,最終的産品形态也是利用深度神經網絡,也利用很多的隐含層和反向傳播算法,隻不過是将深度神經網絡中的點神經元替換成了脈沖神經元,是計算單元的差別,在整個計算架構上差別很少。
是以,可以在充分利用了生物神經元優勢的情況下同時還繼承了這代深度學習的所有優勢,比如說具有通用性,以及從訓練的角度上是 model-free ,這依然是一個以資料和經驗來驅動的過程。
Bragi 說:「我們和 DeepMind 、
OpenAI等最大的差別是,我們很清楚脈沖神經網絡在感覺資料流計算上的巨大優勢,并知道如何從軟體上和硬體上實作它。對這一代深度學習來說,正如 Google 資深研究員
Greg Corrado在 Brain Forum 上所說,他們尚不清楚如何利用脈沖進行計算,在算法層面和應用層面發揮脈沖的優勢 。我們與 IBM 差別是,IBM 的最新突破用 GST 相變材料首次完整第實作了單一神經薄膜,這是基于對生物神經元實體性質的深入了解與再現,但要開發應用于實體世界的大腦晶片, 僅靠複制生物神經元的實體性質是不夠的,根本上仍然需要對生物神經元計算原理的掌握,後者是 Demiurge 的核心優勢。」
遊戲規則制定者
了解生物神經元的脈沖計算原理,是神經科學領域的世界級難題,同時對人工智能界的下一次突破也意義重大,面對這樣一個不論是從科研還是從應用上都将帶來巨大價值的命題,Demiurge 作為一個資源有限的創業公司是如何做到的?
「不應該是艾倫實驗室、索爾科研究所、
HBP等世界級腦科學研究機構,或者谷歌、Facebook 等科技巨頭才有動力和能力去解決這樣一個世界難題嗎?」我非常直接的向 Bragi 詢問。
「就像阿基米德那個用杠杆去撬動地球的比喻,對于撬動這個世界級難題來說(了解生物神經元的脈沖計算原理),有很多不同支點(探索方法)可供選擇。比如說各國腦計劃的研究重點主要集中在提高探測裝置和研究手段,使得我們能夠盡可能收集從局部到全部、從單個時間點到更大時間尺度上的盡可能多的關于神經元的資料,他們大多是從收集資料的角度來努力。」
「艾倫研究所在這方面做了很多貢獻,不僅提供了系統化資料收集的标準和資料收集的裝置,同時還把收集上來的資料加以整理并免費開放,他們的思路是,更多的資料可能會幫助我們最終解決算法的問題,這是大資料驅動的對算法的了解。而歐盟腦計劃(HBP)的思路不一樣,他們認為,即便是收集足夠多的資料,但缺少模拟的過程,對資料的利用效率也不夠高,是以他們特别強調建立一個全尺度、高精度的虛拟大腦,這樣就能保證在虛拟大腦裡重制已經觀察到的大腦的現象和特征,進而讓我們更加準确的提出測試各類神經元的計算模型,這也是從藍腦計劃到歐盟人腦計劃的一個重點。」Bragi 說。
Idonae 補充到:「以上這些研究更多的是提供了基礎設施,支點都離問題比較遠,而不是直接去解決這個問題。而 Demiurge 選擇了最近的支點(完全專注于單個生物神經元),并打造出了最長的杠杆(提出了通用的脈沖計算模型),是以能夠以有限的資源撬動無限的潛力。」。
她認為「下一代深度學習是一個底層應用問題,不是一個表層應用問題。底層問題則需要對多領域深入的了解和靈感來尋求突破,還需要對應用核心痛點的深入了解,是以預測和管理更具挑戰性。而表層問題可以用循序漸進改良的方式推動,産出和時間相對容易預測。在學術界和大企業機構,相關評審機制的設計和運作有利于解決表層應用問題,但對解決底層應用問題的機制缺乏動力和經驗。是以在解決底層應用問題上,Demiurge 量身打造的文化制度和評審機制就會顯示出獨特的優勢。」
Demiurge 聯合創始人、CEO Idonae Lovetrue 在 TEDx Hochschule Luzern 演講,圖檔來源 Demiurge Technologies
在此前的 TED 演講上,Idonae 也提到了 Demiurge 相對于科技巨頭的優勢,「大企業顯然有多種優勢:充足的資源、雄厚的财力和強大的網路,但開發應用于實體世界的人工智能最重要的事情是生存本能,但這與大企業的屬性相悖,企業一旦做大,保持其生存本能就會極其困難。但生存卻是創業的一切,并且它在每個人的血管中流淌,我何時何地都能感受到它。」
「是以,Demiurge 為自己創造了一個非常獨特的位置,掌握了一個從科學的利益和動力、産品的利益和動力的完美契合點,」Bragi 表示,「單個神經元計算模型這個問題既是從深度學習應用需求來說必須要解決的根本問題,同時也是神經科學領域一個諾貝爾獎級别的問題。比起學術界,Demiurge 離應用最近,可以獲得一些額外的關鍵啟發和應用場景下的限制條件, 更有能力去做這個事情。比起工業界,Demiurge 離科學最近,能夠非常專注地去徹底解決應用的底層問題,更有定力去完成這個事情。」
而恰恰是因為 Demiurge 所堅持的這個目标也是神經科學家一直以來的終極目标,是以神經科學領域的頂尖機構和專家非常支援他們,為他們提供研究成果、資料和人才。是以從這方面來說,Demiurge 和神經科學領域的大機構是一種合作關系,而非直接的競争關系,而這種合作關系也是平等的優勢互補,這些科學家不是在通常情況下的單方面付出,而是可以獲得回報。
「我們就像魔戒遠征隊,而那些在神經科學領域已走得最遠的專家就像是精靈族的長老,用他們的的知識和智慧來幫助我們。」Idonae 說。
今年 5 月份舉辦的世界頂級神經科學會議 Brain Forum 也邀請了 Demiurge ,他們的展台就在神經科學巨無霸項目「歐盟人腦計劃(HBP)」的旁邊,Brain Forum CEO Jamil El-Imad 對 Demiurge 贊賞有加,他在大會開始前的媒體見面上唯一介紹的一家創業公司就是 Demiurge ,「在所有的創業公司中,Demiurge 的視野(vision)與我内心所想最為接近。」Jamil 在私下交流時說到。
就連不可一世的歐盟人腦計劃和瑞士藍腦計劃的負責人、全球頂級神經學家 Henry Markram 也在一直積極且慷慨為 Demiurge 提供支援——将他了解的科學家與他的學生介紹給 Demiurge 。
Brain Forum 會場,歐洲腦計劃(HBP)發起人 Henry Markram 和 Idan Segev與 Demiurge 創始人 Idonae 和 Bragi 交流,圖檔來源 Demiurge Technologies
在這次遠征中守護他們前行的不僅有科學家,還有投資人,Demiurge 目前完成了兩輪投資,投資人包括對技術有着極強前瞻性的投資機構和知名企業家。Idonae 說:「深度學習是一個生态系統,不僅跨越了很多應用,還突破了傳統應用和研發之間的壁壘,我們需要很多背景去了解和應對這個全新的生态系統,投資人的經驗和視野在這方面可以給我們很多幫助。」
各類人才的彙集讓 Idonae 充滿信心,「我們隻要堅持走在解決這個問題的路徑上,最适合的人會一個一個陸續登場,而每個人都必然是在相關領域深耕良久,因為隻有有了很深的積累之後才有足夠的眼光看到我們解決這個問題的必然性。」
而對于 Demiurge 來說,他們不僅希望自己創造的這套新的遊戲規則能夠幫助他們解決具體問題,還希望這個規則本身可以為後來者提供一種史無前例的參照。
「我們在創造一個先例,從來沒有人說過創業公司不可以通過解決一個諾貝爾獎級别的問題來直接開發出堪比網際網路基礎的人工智能技術,隻不過是很少有人有勇氣做這方面嘗試,而我們非常清楚我們的目标是什麼,我們存在的意義是什麼。我們希望自己是啟發性的,也可以讓後面的人有一個新的參考體系。」Idonae 表示。
「為什麼是我們?我們對現有的遊戲規則很了解,并且非常清楚做到什麼程度才算是真正的成功,」Idonae說,「通用人工智能的成功标準,高于在 ImageNet 競賽中取得高分,高于實作完全的自動駕駛,而是能夠實作人人可居的智慧城市,人人可獲益的地外探索。」
自動駕駛
Demiurge 基于生物神經元計算模型所提出的下一代深度學習及相關的軟硬體平台, 可以做到高性能、低成本的解決小樣本學習和自适應學習等人工智能在真實世界中所面臨的諸多問題。從目前來看,這項技術最直接、也是最有市場需求的應用就是自動駕駛。
Bragi 和 Idonae 五月份的行程非常密集,他們需要去瑞士中部的盧塞恩進行 TED 演講,然後當天趕到西南部城市洛桑參加 Brain Froum ,會議結束後再傳回公司。Bragi 駕駛着一輛 Model S 在四天裡行駛了超過 800 英裡,沿途再美的風景也會屈服于駕駛員的時間成本和精力消耗,這也是所有人期待自動駕駛早日實作并積極參與其中的原因。
從 20 世紀 80 年代卡耐基梅隆大學的 Navlab 計劃,到谷歌自動駕駛項目,再到如今所有相關公司的強勢布局,衆多參與者都走在追求這個終極目标的路上,每個參與者都會基于自己的優勢規劃發展路徑,神秘的自動駕駛創業公司
Drive.ai就完全押寶于深度學習,将深度學習應用于全自動內建駕駛堆棧,改變用規則去應對各種場景,讓汽車完全自行通過了解資料去學習。
而 Demiurge 的方案不是循序漸進,而是從自動駕駛場景下的小樣本學習和與真實實體世界互動的兩大限制出發,用生物神經元的計算模型從根源上解決這個問題。
「比如說蝗蟲,它們的翅膀非常孱弱,任何撞擊對它們來說都是非常緻命的,但它們在高速飛行中有着幾乎完美的自動避障能力,這背後的機制如果用在自動駕駛汽車上,将會實作第四級别的自動駕駛。最令人吃驚的是,蝗蟲的自動避障系統隻用了兩個生物神經元,一個用來探測障礙,一個用來執行避障的行為,這說明生物神經元在處理實體世界的任務時,從小資料和資料流中的學習和決策能力非常出色,這對我們降低資料需求提供了重要線索。」Bragi 說。
基于深度學習的自動駕駛和蝗蟲自動避障的對比,圖檔來源 Demiurge Technologies
在産品方面,軟體依然是第一位,但如果現有的自動駕駛平台無法與他們的軟體相适應時,Demiurge 也會重新設計硬體,「我們要設計的深度學習晶片也是基于脈沖神經元,是以從硬體實施上也與現在的硬體有所不同」,但 Bragi 沒有透露更多具體細節,「這兩種方法都是可能的,至于選擇哪一種,則是看工程上的需要。」
在衆多自動駕駛領域的參與者中,Demiurge 認為公司最大的潛在競争對手是
特斯拉。特斯拉在去年 10 月通過軟體更新增加了輔助駕駛功能,這個功能在研發時使用了特斯拉車主過去 18 個月積累的 7.8 億英裡行駛資料。在該功能上線後的短短六個月内就積累了 4,700 萬英裡資料,遠遠超過谷歌曆時 6 年積累的 150 萬英裡,而近期特斯拉的這個資料已經增加到 1 億英裡。
Demiurge 把特斯拉視為頭号競争對手的原因在于,目前隻有特斯拉充分認識到現有深度學習對于資料需求量過大的底層問題,并且後者正在用不同方式來逼近這個目标。
Bragi 說:「特斯拉在收集資料上有着壟斷性的巨大優勢,是以能夠利用現有深度學習做自動駕駛,在與大多數同行競争中已然遙遙領先。但特斯拉并沒有滿足這一狀态,Elon Musk 同時通過成立 Open AI 在本質上尋求能夠實作第四級别自動駕駛的下一代的深度學習算法,完全超越競争,這和 Demiurge 的思路是一樣的。」
宏大目标下的生存追問
與 Demiurge 的兩位創始人交流其實是一件壓力很大的事情,不管他們在介紹 Demiurge ,讨論人工智能行業,還是随意的聊天,我都需要努力讓自己的思維保持活躍,以跟上他們的談話節奏和思維邏輯。他們有一種獨特的談話方式,總是會抽繭剝絲般的從現象聊到本質,并會将不同僚物聯系起來推理出通用的規律并進行演繹,既可以自下而上的将具體抽象成理論,也可以自上而下的将理論落實到具體事物或者一個形象的比喻上。
在深入了解他們的創業理念後,才發現他們的所有行為,小到一個聊天的話題,大的公司的研究方向,都可以用一種獨特的氣質支撐起來。
而這種獨特的氣質就是被他們視為競争對手的特斯拉創始人伊隆·馬斯克的「秘密武器」——第一性原理,馬斯克自己對此的解讀是:我認為,人們的思維過程通常都束縛在正常或類似的經曆中。很少會試着在第一原則的基礎上考慮某些事。他們習慣說:「因為我們以前那樣做過,是以我們會這樣做。」或者,他們不做這事是因為「好吧,之前沒人做過,是以情況肯定不太妙。」但是,這是一種荒謬的思維方式。你必須從頭開始推理,你注視着那些基本條件,然後從中建構你的推理,之後你可以看看是否得出一個有效或是無效的結論——可能會和人們以往的結論相同,也可能不同。
将這種思維落實到行為上,便是基于問題的根源來設定目标,并保證之後做出的所有行為都與這個終極目标息息相關,并是以一種效用最大的方式去實施。
1)基于核心問題提出目标
Bragi 意識到現有深度學習無法解決小樣本學習和與實體世界實時互動的問題,而這恰恰是生物神經元所擅長的,是以他就直接去研究所學生物神經元的計算模型,以創造下一代深度學習并付諸實用。相信很多人工智能領域的從業者都可以發現目前深度學習的問題,也經常有人表示需要讓機器像人類一樣學習,但很少有人、尤其是創業公司會把這個問題作為自己專注的研發目标,更多的是去選擇一些權宜之計。但對于 Demiurge 來說,他們不僅理性的發現了這個問題,同時又有着足夠的勇氣去挑戰它,而從來不會考慮此前是否有創業公司這樣做過。
Demiurge 會讓人不自覺的想到另外一家如日中天的人工智能創業公司 DeepMind ,都是學術與應用相結合,都是專注于通用人工智能,且創始人都有着神經科學和人工智能的複合背景。
當被問到和 DeepMind 的異同時,Bragi 表示:「被谷歌收購之前的 DeepMind 和我們很像,我認為他們接受被谷歌收購是『the best scenario of failture for DeepMind(最好的失敗)』,因為如果他們率先解決了通用人工智能這個問題,那麼谷歌被 DeepMind 收購将會是『the best scenario of failture for Google』 。我不知道他們是在研究了三四年之後遇到了瓶頸,還是說一直把這個(被收購)當成備選方案。」
當被問到谷歌所提供的資料和資源支援是否會成為 DeepMind 的競争優勢時,Bragi 依然是從目标出發給予了否定,「我們看的非常清楚,解決實體世界的問題,大資料不是一個幫助,而是一個掣肘,想要利用谷歌的資源和資料優勢,我們認為是沒有真正了解解決這個問題的方法。」
「我判斷的标準是一個公司是否把最核心的資源、人和時間放在最關鍵的問題上, DeepMind 被谷歌收購前是這樣,但現在有點不一樣了。」Bragi 非常堅定地認為,「比如說 AlphaGo ,它很好,但不是我們想要的」。
Demiurge 創始人表示,他們隻想去解決一個問題:讓人工智能不再隻是成為談資,也不是炫目的展示,而是讓大家在生活中能夠獲得便利和切實的好處,或者通過平價地外探索去獲得人類文明新次元的可能性,這個是他們投身人工智能的目标,他們隻想達到這一個目标。
2)圍繞目标的生存法則
Idonae 認為,Demiurge 看到了一個人工智能應用的關鍵問題,并擁有對這個問題的興趣以及解決這個問題的決心。是以确定了這個目标之後,Demiurge 的每一個動作都極其嚴苛的圍繞它去實施,而不在乎正常做法是什麼,以及通行的遊戲規則是怎樣。
「和生物一樣,我們所做的事情也是生存驅動的,」Idonae 說,「我們這個旅程就是要抵達終點,我們要知道每一天如何更逼近自己的目标,并以一種能耗最低的方式往前跑。如果在這個過程的每一步都要符合主流的預期,做一個好的表現者,同時又要以最快的速度抵達終點,那這個預期本身就是沖突、不切實際的 。有人擅長把每一步都做的漂亮,每一步都有掌聲,這是一種做法,但這不是我們擅長的做法;我們不在乎這一過程的孤寂,隻在乎是否抵達真正的終點, 是以,我們或許隻會攢到一次掌聲,那就是當絕大多數人都因這項基礎技術而受益時為我們的産品而鼓掌。」
這種狀态 從Demiurge 創立之前就已經展現了出來,Bragi 在紐約大學讀大學時,為了弄清楚如何實作通用人工智能,他就向學校申請自主設計了一個全新的大學專業——覆寫計算機科學、人工智能、神經科學、實體學和哲學,設計并完成了大量的博士級别的研究課題。後來在計算機名校卡耐基梅隆讀研期間,他也沒有按照大多數人的通行研究路徑選擇繼續讀博。
「先弄清楚到底怎麼樣做才能實作通用人工智能,然後從解決這個問題來追問所有的決策,而不是說會做任何形式上的妥協。這個是我們每做一次看似不尋常的選擇時背後的邏輯,其實就是對問題本身的探求和了解。」Bragi 解釋到。
Demiurge 還做了一件在大衆看來不太尋常的事情。今年 3 月,谷歌計劃出售機器人公司
波士頓動力,Demiurge 立即在自己的 Medium 首頁釋出官方聲明,表示希望收購波士頓動力公司,将波士頓動力公司的相關技術整合到基于 Demiurge 深度神經網絡的新一代機器人作業系統中。
采訪期間,谷歌宣布将波士頓動力出售給豐田。「賣給豐田是波士頓團隊第二好的選擇(注:Bragi 認為,最好的選擇是被 Demiurge 收購),波士頓動力本身含有不同聲音,有人堅持基于控制論的模型設計,但面對複雜的人與外部真實環境的互動,開發模型是極其困難的。有人相信深度學習能夠模拟任意函數的模組化優勢,但是用深度學習進行端對端模組化, 需要遠超谷歌能力的海量的傳感和控制資料 。他們所面臨的最核心的難題恰恰是我們可以為他們解決的,就是與真實實體世界互動的深度學習系統。」Bragi 說到。
雖然交易未能達成,而 Demiurge 作為一個初期創業公司所發出的這個聲明也沒有得到大範圍的媒體關注,但這件看起有些不可思議的事情恰恰展現出 Demiurge 的理念。
公司把這個作為唯一标準來篩選人才、投資人,甚至是公司的地理位置。在一年多前的一個内部讨論會上,當 Idonae 提到要把公司設在瑞士時,在場的所有投資人和專家都表示很難了解。當今天再回顧這個問題時,現實的回報讓 Demiurge 的創始人确信當初選擇的明智,「公司的選址取決于你要做什麼類型的創業,我們是要解決深度學習的核心挑戰,同時也是腦科學的難題,解決這個問題之後還要将一系列技術産品化,把這些結合起來看,瑞士是最合适的。瑞士有着全球領先的神經科學和機器人技術,而且瑞士特别适合全球市場的高科技企業的成長與發展(比如羅氏、諾華以及 ABB )。而我們的技術應用是一個萬億級别的全球市場,在行業合作、産品和安全标準制定、甚至是國際間的多重合作方面,瑞士都有着穩固的優勢。」
Idonae 還說「我們最看中的還是人與人的吸引,什麼樣的問題吸引什麼樣的人進來,而歐洲的人才池對我們這個問題最感興趣,也是最了解及最能提供貢獻的。同時,我們也看中瑞士的視野和地緣裡的養分,瑞士尊崇着商業長久之道的本質,不鼓勵通過對個人的崇拜轉化為産品銷售力,而是推崇用最好最可靠的産品品質赢得市場,與客戶建立長久簡單的供求關系。 在這方面,瑞士給了我們一個非常重要的參照環境,讓我們體會到下一代深度學習産品應該怎麼做」。
這種基于目标的生存追問成為 Demiurge 的文化基石,使他們做所有決策非常簡單,因為這是他們唯一的标準。這個标準不僅幫助他們找到了最合适的辦公場所,吸引到了最适合專家和團隊,還讓他們在前行的路上可以極度理性的看待争議和否定,摒除一切幹擾因素。
在評論馬斯克的
第一原理時,Tim Urban 用了一個非常簡潔的描述:「 Things I want → Want 」。Idonae 有着同樣的理性和堅定:「我們就一個目标,很簡單,就是要到達哪兒,一路上沒有建設性的争議和否定不能給我任何食物和魔法幫助我去接近這個目标,是以我們會自動過濾。在這個路程上,我們就是不斷選擇、凝聚能了解我們理念,并能提供不可替代價值的人,我們不會去在乎其他。批評和諷刺的聲音隻有在看到産品,或者通過産品解決他們的需求時才會發生改變。我們是創業團隊,我們要生存,是以我們會動用所有的資源放在解決這個問題上,這個問題解決了,産品本身就是答案。」
基于目标的生存追問讓 Demiurge 敢于去解決一個世界難題,吸引到領域内頂級的科學家為他們提供支援,創造了第三種遊戲規則,還組建了在每個環節上都擁有 1-2 名頂尖研究者的強大團隊,包括數學家、神經科學家、機器人學家等。同時也形成了他們自己一套獨特的管理方式——像特種部隊一樣用時間來激發最大潛力。
從科技史的發展來看,Bragi 認為科技的突破很難預測,因為之是以成為突破就因為與現有技術有着質的不同,而我們的預測又是基于對已知技術的了解, 是以預測本身是不可靠的。
面對公司目前在做的這樣一項質變而非演變的技術,從内部管理來說,他們挑選出來的成員都是有着相同的生存本能——所有任務的期限,就是自己毫不妥協地完成任務所用的最短時間。
Idonae 說「就像是英國特種部隊的野外徒步訓練,教官不告訴特種兵任務的 deadline ,是以沒有人知道 deadline 的具體時間,但都知道它的存在,是以每個人都會竭盡全力以最少的時間來完成任務,激發出最大的潛能。我們的團隊成員都是這樣,必須全力以赴,以最短的時間高品質的完成每一個任務。如果我們人為設定一些時間點,如果過短,就會迫使大家走一些錯誤的捷徑,如果過長,反而會讓人松懈自滿。我們要一直處在尋求生存的狀态下才能夠最好地生存下去。」
Tim Urban 認為培養馬斯克的思考方式有三個次元:1)對已知的事物保持謙遜;2)對可能實作的事物保持自信;2)對無關緊要的事物不存怯懦之心。
與之類似, 如果将 Demiurge 理念進行拆解的話,就是他們印在公司 T 恤上的 5 個短語:仁愛的理性(empathetic rationality)、謹慎的無畏(prudent fearlessness)、有批判精神的信仰(skeptical faithfulness)、謙遜的靈魂(humble souls)、勇敢的思想(daring minds)。
Idonae 對此的解釋是:「要心懷遠大,但恰恰是因為非常了解目标的遠大,是以才知道每一步所必要的謹小,既做到感情上的認同,又極其理性地去分析,因為靠一腔熱血是走不遠的;對目标極其堅定,但在前往目标的道路上時刻保持批判精神;有謙遜的靈魂才會接近客觀地了解問題,了解一路上将要面對多少艱難險阻,而勇敢的思想是我們的生命之源,使我們能夠自信認定地一步一步走下去。」
Demiurge 公司 T 恤上還有另外一個圖案,是線蟲、魚、昆蟲、狗和嬰兒五種從低級到進階的生物,下面依次标注了各自的神經元數量。這些神經元憑借一種目前還不為我們所知曉的機制互相連接配接,讓生物擁有在現實世界中生存下去的智能。
而 Demiurge 自身也是這樣一個「神經元」,以實作智能為最終目标,同時以一種效率最高且目的性最強的方式做着每一次與外界的連接配接。生物神經元的計算模型 Demiurge 還在研究和測試,但 Demiurge 自身生存和成長的機制他們已經找到,正是這種機制将 Demiurge 的目标、研究、管理和合作等所有行為都完整地融合在了一起。使他們成為一個擁有智能的生命體更好地生存下去,并幫助他們創造出更多的「生命體」。
20 世紀偉大的實體學家埃爾溫·薛定谔的著作 《What is Life》前言裡有這樣一段話:
「古往今來,從探索中發現普遍的真理是最有價值的。但是過去一百年中所積累的衆多實體學領域的知識,其廣度和深度,讓我們對統一真理的探索面臨如下挑戰:一方面,我們已經開始掌握了能夠将各個領域的知識融彙貫通的辦法;另一方面,即便是對某一學科領域更加專業化的知識,如果想要徹底掌握它幾乎又是不可能的事情。隻有我們中的某些人,敢于冒着自己被看成是愚蠢之人的風險,去大膽地綜合所有發現和理論,我們才有可能擺脫挑戰,發現普遍真理。」
對于 Demiurge 乃至今天的人工智能領域來說,可能也是如此。
©本文由機器之心原創,轉載請聯系本公衆号獲得授權。