天天看點

科學家正讓AI自己做實驗,想要機器擺脫人類的直覺

本文來自AI新媒體量子位(QbitAI)

科學家正讓AI自己做實驗,想要機器擺脫人類的直覺

如果說這是未來的生物實驗室,它似乎與現在的實驗室沒有多大差别。

裡面有身穿白大褂的科學家,還有許多放着冷凍試管的盒子。架子上的化學品——有一瓶瓶的純酒精、一罐罐的糖、蛋白質和鹽——都是培養微生物和操縱它們基因的标準配置。

在聽到機器人的聲音前,你甚至不會注意到它們的存在:它們就像蟋蟀一樣,用低沉的聲音為彼此歌唱。

這些機器人都為Zymergen效力,這是一家生物技術公司,2014年搬進位于舊金山灣東岸的這個電子工廠舊址。他們在這裡開展微生物實驗,尋找各種方式來提高有用化學物的産量。裡面有一台機器人名叫Echo(不是亞馬遜那個Echo)。在一堆笨重的裝置裡面,有一個機械手臂抓取了一個塑膠孔闆,上面放着幾百個盛着液體的孔。

一束雷射掃描了孔闆側面的條形碼,然後由Echo将其放到托盤上。之後的流程十分精細,用肉眼根本無法看清。

科學家正讓AI自己做實驗,想要機器擺脫人類的直覺

“這并不是複制了我手動移液的過程。”該公司聯合創始人兼營運和工程副總裁Jed Dean說,他是一位分子生物學家。“而是一種截然不同的方法。”不必使用移液管吸取液體,然後把液體逐一注入每個容量隻有細胞那麼大的孔裡面,機器人整個過程都沒有觸碰它。相反,它使用了每秒500次的聲波脈沖讓液體自己震動,形成比手動操作小100倍的液滴。

這些都算不上多麼具有未來感。大型生物學實驗室多年以前就開始使用機器人和條形碼。即便那種名為“聲學微滴噴出”的移液技術也已經存在了數十年。

但是,當我向Dean詢問這個機器人正在從事什麼項目的時候,才真正了解其中的玄機。“我不知道。”他說。他可以輕易得出答案,但這個實驗并不是他設計的,而是由電腦程式自動生成的。

“我再說明一下,”Zymergen CEO Joshua Hoffman準備消除我們之間的誤解,“這一過程中有人類科學家的參與,他們負責檢視結果,并進行事實核查。”但之是以用程式來解讀資料、生成假設和規劃實驗,最終目的還是“擺脫人類的直覺”。

與Zymergen秉承相同目标的公司還有好幾家:他們都在利用人工智能技術增強甚至取代人類在科學流程中的作用。

科學家正讓AI自己做實驗,想要機器擺脫人類的直覺

他們将其稱作“人工智能支援的生物科技”,但Zymergen的聯合創始人卻不太喜歡這種說法,“‘人工智能’聽起來像是機器人在下象棋。”該公司CTO Aron Kimball說,“我更喜歡‘機器學習’。”霍夫曼說,他所說的機器學習是計算機科學的一個分支,最近的人工智能技術進步幾乎都來自這一領域。“這樣更能說明我們在幹什麼。”

Zymergen的工作其實是調整工業微生物,進而為生物燃料、塑膠或藥品制作原料。為了增加産量,很多企業都把繁重的工作交給Zymergen來完成。該公司的機器人之後會探索和修補每個微生物的基因,希望能夠設計一個更好版本,提升其化合物的效率。

霍夫曼表示,問題在于,送到Zymergen的微生物已經“高度優化”。經過多年的研究和培育,這些細胞已經非常擅長它們所從事的工作。是以,想要進一步提升效率,就需要更加深入的探索基因,開展實驗,然後使用所能獲得的各種資料——換句話說,就是搞科研。

Zymergen試圖加快這一過程。Hoffman表示,“一個人整天忙個不停也隻能測試為數不多的假設,大約每月10個。”機器人則能加快這一過程——Zymergen的機器每周可以做1000次試驗。但機器人隻能遵照指令執行:如何向它們下達正确的指令才是真正的瓶頸。

當我問他們,這種算法是如何設計實驗的時候,Kimball舉了個簡單的例子。“你拿到的原始微生物大約有5000個基因。假設有10種方式可以改變一個既有基因,那就要做5萬次試驗。”這些實驗首先要制作1000個菌株,每一個都要有專門的突變。“每一個放在一滴裡面。你可以向其中添加糖,培育一會兒,然後看看能得到多少産品。”可能有25個菌株可以多生産一些目标化學物。這些菌株可以用于培育下一輪實驗使用的菌株,其餘的放到冰箱裡面。

但要發現過程絕非一帆風順。Kimball表示,光是找到合适的突變就需要經過漫長的過程。如果隻是一門心思想要實作最高效率,幾乎不可能到達巅峰。原因在于,如果你隻是将所有能夠實作輕微提升的突變合并到單一的微生物裡,未必能夠實作重大改進。相反,由此生成的菌株會“生病”,效果遠不及最初的菌株。是以,選擇合适的路徑(包括繞道達成目标)需要繪制一份心理地圖,同時展示所有菌株的所有效果——這份地圖不隻是3個次元,而是數千個次元。這就需要機器學習來指引方向。

但其中還是有一個關鍵差異:當機器人終于發現能夠提高化學品産出的基因變化後,他們不會了解這些效果背後的生物化學原理。

如果不能加深我們對生物學原理的了解,這還能算科學嗎?在Kimball看來,這種哲學視角或許并不重要。“我們之是以能賺錢,是因為這的确有效,而不是因為我們了解背後的原理。”

Hoffman表示,Zymergen的機器人實驗室已經可以把利用化學過程生成微生物的效率提升10%以上。聽起來似乎不多,但由于依靠微生物發酵的化學行業每年産值高達1600億美元,是以隻需輕微的改進,就可以超過美國國家科學基金會70億美元的年度預算。

而且,機器人發現的先進基因變化的确是實實在在的發現,這是人類科學家很難做到的。

例如,多數能夠提升産出的基因都與希望合成的化合物沒有直接關系,其中約有半數沒有已知的功能。“我在幾種不同的微生物中看到過這種情況。”Dean說。要在沒有機器學習的情況下找到合适的基因組合,就像要破解帶有數千個數字的保險箱一樣困難。“我們的直覺很容易被複雜性壓倒。”他說。

究竟能将多少科研過程委托給機器學習來執行?這取決于你詢問的對象。

“很多。”研究基因組的加州大學戴維斯分校計算機科學家Ilias Tagkopoulos說,“我們沒有理由不能讓資料來指導實驗過程,進而擷取盡可能多的資訊,最終更加接近我們的目标。”在他那些看似無窮無盡的應用中,包括預測細菌在變化的醫院環境中如何進化,以及設計更好的零食。

如果機器真的能夠在某些科學任務中取代人類,很多科學家都将主動擁抱它們。

科學家正讓AI自己做實驗,想要機器擺脫人類的直覺

與工廠勞工和計程車司機不同,科學家還是很希望自己的工作能夠多融入一些自動化流程。對于分子和細胞生物學來說尤其如此,因為這些領域的手工操作(包括注射液體、菌落計數等)過程既單調乏味,又成本高昂。一個研究所學生的犯一點小錯,或者有一點不嚴謹的缺陷,就會浪費幾個星期的時間。更糟糕的是,負責設計實驗的博士後的一個草率決定,甚至會導緻幾個月的努力付諸東流。

然而,有的生物學家在使用人工智能來解讀資料和設計實驗之後,卻感到挫敗。“我們發現,目前的機器學習方法還是不太勝任這項任務。”斯坦福大學計算機生物化學家Rhiju Das說,他研究如何通過分子折疊來設計新藥。“與獲得同等資料的人類相比,它們在RNA設計問題上很失敗。”盡管他并不知道具體原因,但涉及到“設計”的任務似乎都需要人類的直覺。或許Zymergen無意中發現了适合用電腦做實驗的生物學領域。

加州Transcriptic公司也是一家探索自動化技術的生物科技公司,其聯合創始人Max Hodak似乎看到了這種方法的局限。

他相信機器人會在實驗室裡從事更多單調的工作。他說,要不了多久,“如果你還在使用雙手,那就不算做科研。”

但生物大腦短期不會被取代,原因在于自然界十分複雜。Hodak表示,進化“負責讓生物更加豐富,這也是它如此難以了解的原因。它擁有不可思議的複雜性。”他認為,在設計更好的實驗的過程中,人工智能可以給生物學家帶來有限的幫助。但他也擔心把更多的科研流程交給機器人來做,表明“它比我們預想的更加複雜。”

而且,即便人工智能控制的科研過程能夠奏效,人類真的能了解電腦的發現嗎?背後的計算過程可能仍然是個黑盒子。“一種令人感興趣的可能是:我們正在接近一個‘可以了解的’科學時代。”與分子生物學家合作的卡内基梅隆大學計算機科學家Adrien Treuille說。研究人員可能不僅依賴計算機做科研,還會利用計算機進行解釋:有的生實體論證據可能過于複雜,需要給予計算機足夠的信任。

倘若如此,科學家是否應該把電腦作為共同作者寫道論文的署名上去?“我不會這麼做。”波士頓Nutonian公司CEO Michael Schmidt說,這家公司就利用人工智能來從事科研。但他也補充道,“但如果它們能夠讀懂論文,那也可以成為作者。”

這一天正在到來。

【完】

本文作者:李杉 

原文釋出時間:2017-07-08 

繼續閱讀