如何發現并建立一種新型的藥物或療法?這是所有生物技術或制藥公司長期面對的基本問題。
總體而言,目前的藥物發現方式有兩種:基于靶點的方法和基于表型的方法。其中,基于靶點的藥物發現(Target-based Drug Discovery,TDD)需要率先了解緻病機制或針對相關通路展開探索;而基于表型的藥物發現(Phenotypic Drug Discovery,PDD)重點則在于識别出可改變細胞表型的化合物。
相較而言,後者更加乏味耗時、且成功率不高,這些客觀因素導緻基于靶點的藥物篩選在過去的幾十年間形成了主流。不過近年以來,随着細胞表型篩選技術、CRISPR-Cas 技術、類器官和成像分析技術等領域的飛速發展,表型藥物發現方法重新回到了人們的視野。
(來源:JUMP–Cell Painting 聯盟)
對此,來自哈佛和麻省理工學院博德研究所的一組研究人員基于先進的機器學習方法,建立了表型分析技術 “Cell Painting”。該技術旨在通過高通量成像實驗生成大規模的多元資料集,其中包含每個細胞的可量化表型資訊。基于這些圖像資訊,研究者可以使用深度學習等方法識别出化學或遺傳擾動産生的影響,進而探究各種疾病的病因和治療方法。
近期,由部分國際知名的生物技術企業的 “Cell Painting” 資料彙總并建立的大型資料庫 JUMP Cell Painting Datasets 正式向公衆開放。對此,建立該資料庫的生物技術企業聯盟表示,希望資料庫能夠幫助研究人員識别有潛力的化合物,并且在進入動物或人體試驗之前對于目标化合物的功能,及潛在副作用進一步了解,最終加速藥物發現程序。
“測量一切,繼而評估” 的表型藥物發現技術
早在上世紀 80 年代左右,受限于當時的生物科學技術水準,人們對于疾病的認知普遍停留在表型層面,很難建立其與靶點之間的關聯。是以,大多數早期藥物的發現主要是依靠表型藥物發現方法(PDD)。
對于 PDD 模式而言,其工作重點在于評估某一化合物能否在生理模型中顯示出預期的反應。這就需要研究者開展大量細胞實驗,然後通過比較圖像變化進而獲得結果 —— 比如熒光标記蛋白的變化,或者分裂細胞數量減少等等。可想而知,這些龐雜的工作既乏味又耗時,而且十分容易失敗,因為可能導緻的結果完全是随機的 —— 研究人員也不确定究竟是哪一部分圖像會發生變化。
由此也就不難了解,在過去的幾十年間,基于靶點的藥物發現(TDD)模式發展成為了藥物發現領域的主流。由于靶點明确,對于該方法而言,藥物發現的時間、過程和所需資源都是可以預測的。
然而,随着可用靶點的挖掘工作逐漸進入瓶頸,研究者逐漸意識到,單一的發現模式并不足以解決所有問題。是以,建立在生物系統之上,與疾病直接相關的表型篩選模型再次得到重視。
▲圖丨基于圖像的形态學分析政策概述(來源:Nature Protocols)
在表型篩選模型中,目标化合物将直接 “通路” 相關的生物系統或細胞信号通路進而産生結果。“一切與靶點無關”,這是其與靶點發現模式的根本差別。不過,如何在海量圖像中準确識别并抓取有效資料,仍是該領域發展的關鍵所在。
2013 年,來自博德研究所的一組研究人員于 PLoS ONE 線上發表論文,提出使用多達 6 種熒光染料來為細胞的主要成分 “上色”,包括細胞核、内質網、線粒體、細胞骨架、高爾基體和 RNA。然後使用顯微鏡捕捉這些帶顔色的圖像,并通過軟體測量其形态學特征進而繪制出細胞表型 “指紋”,用其訓示細胞所處的不同生理學狀态。最終,使用基于 AI 的圖像分析技術比較試驗前後的圖像變化,以評估分子或遺傳幹擾所産生的的影響。
▲圖丨 Cell Painting 圖像資料示例(來源:博德研究所)
“測量一切,繼而評估”,這一思路很好地概括了 “Cell Painting” 的基本工作方式。特别是随着機器學習技術與各類分析方法的不斷發展,研究人員能夠以更輕松的方式獲得大規模的生物資訊資料。
2016 年,該方法被正式命名為 “Cell Painting”,該技術由博德研究所的 Carpenter–Singh 實驗室主導。其中,該實驗室的上司者之一、計算生物學家 Anne Carpenter 表示,這 “幾乎是管理起來最簡單的成像分析”。作為該方法的開發者之一,她強調,“我們的任務是選擇最便宜、最簡單的染料。”
後期運算成本較高,仍獲知名藥企追捧
該技術一經釋出便受到了部分國際知名藥企的追捧。在此之後,引入 “Cell Painting” 技術的制藥公司共同成立了名為 JUMP–Cell Painting 的聯盟,并将各企業的 “Cell Painting” 資料資源進行了彙總并建立成為一個大型資料庫 JUMP Cell Painting Datasets,該資料庫現已在 github 網站上線。據悉,資料庫中包含了細胞對于 140,000 餘種擾動做出反應的圖像,包括藥物治療或其它一些可以提高或降低基因活性的修飾。
▲圖丨 JUMP–Cell Painting 聯盟企業名單(來源:博德研究所)
現階段,越來越多的藥物開發公司開始重視并積累來自各個次元的細胞資料,然後将其應用于機器學習。特别是對于表型分析而言,盡管目前看來該方法可能具備巨大的價值,然而研究者同時指出,該方法在分析軟體方面提出了相當高的準入門檻。例如需要仔細研究分析方法,進而規避可能存在的過度拟合、資料混雜以及偏差等風險,這将有可能提高其後期的運算成本。
基于該資料集,Carpenter 和她的同僚已經發現了十幾種可能對肌肉癌造成影響的化合物。在此之後,Carpenter 計劃與其合作者共同創辦一家公司,以便進一步開發其中最有前途的候選化合物。
同樣值得關注的還有新藥研發企業 Recursion Pharmaceuticals。在 2014 年公司創立初期,Anne Carpenter 曾在該公司擔任科學顧問。在她的幫助下,Recursion 很快基于表型組學分析技術建立起了藥物發現平台 Recursion OS。發展至今,該公司已經建立起十餘項涉及惡性良性腫瘤學、神經科學、發炎和免疫學以及罕見病領域的研究項目,其中已有 5 條管線進入臨床試驗階段。
▲圖丨 Recursion Pharmaceuticals 産品管線(來源:Recursion Pharmaceuticals)
在本次資料庫公開發表之後,JUMP-Cell Painting 聯盟還宣布将與華盛頓特區的健康與環境科學研究所開展合作,以期将 “Cell Painting” 資料與其它類型資料相結合,進而用于預測藥物和農用化學品的毒性。
參考資料:
1.https://doi.org/10.1371/journal.pone.0080999
2.https://doi.org/10.1038/nprot.2016.105
3.https://www.technologyreview.com/2023/03/03/1069261/a-technique-called-cell-painting-could-speed-drug-discovery/
4.https://github.com/jump-cellpainting/datasets
5.https://jump-cellpainting.broadinstitute.org/partners