天天看點

《自然》榜單:有望改變2022年科學程序的7大前沿技術

從基因編輯到蛋白質結構解析,再到量子計算,以下七項技術或在科學界産生重大影響。

《自然》榜單:有望改變2022年科學程式的7大前沿技術

端粒到端粒(T2T)合作組正在對所有染色體進行測序 | Adrian T. Sumner/SPL

1 完整版基因組

2019年,加州大學聖克魯茲分校的基因組學研究員Karen Miga和美國國家人類基因組研究所的Adam Phillippy成立了端粒到端粒(T2T)合作組,當時約有1/10的人類基因組仍然未知。如今,這個數字已經降到了零。在去年5月釋出的一篇預印本論文中,T2T合作組公布了首個人類基因組的端到端序列,為大量使用的人類參考基因組序列GRCh38新增了近2億個堿基對,并為人類基因組計劃(Human Genome Project)補全了最後一章[1]。

首次于2013年公布的GRCh38是一個很重要的研究工具,也是繪制測序序列的架構,但這個架構上還開着很多“天窗”。這主要是因為廣泛使用的測序技術(由加州Illumina公司開發)雖然讀長很準确,但太短,無法清晰繪制出高度重複的基因組序列,包括染色體末端的端粒以及在細胞分裂中協調新複制DNA分裂的着絲粒。

長讀長測序技術被證明能改變之前的測序規則。這一技術由美國太平洋生物科學公司(Pacific Biosciences)和英國牛津納米孔技術公司(ONT)聯合開發,可以一次性讀取數萬乃至數十萬個堿基并進行排序,雖然在剛開始時并不絕對準确。

然而,當2020年T2T合作組首次重組了單獨的X染色體和8号染色體時[2,3],Pacific Biosciences公司的測序技術已經可以讓T2T的科學家檢測到長片段重複序列中的微小突變。這些微小“指紋”讓長段重複的染色體片段變得更易處理,基因組的其餘部分也能迅速歸位。ONT公司的平台還發現了許多調節基因表達的DNA修飾,而T2T合作組也能在全基因組範圍内繪制這些“表觀遺傳标記”[4]。

T2T合作組解析的這個基因組來自一個包含兩組相同染色體的細胞系。正常的二倍體人類基因組中,每個染色體都有兩個版本,研究人員正在研究“基因分型”(phasing)政策,這種政策可以将每個序列準确配置設定給對應的染色體拷貝。Miga說:“我們已經獲得了一些非常出色的分型組裝。”

這項二倍體組裝工作是與T2T的合作組織——人類泛基因組參考合作組(Human Pangenome Reference Consortium)——共同完成的,該合作組希望基于來自世界各地的數百個捐贈,繪制出更具代表性的基因組圖譜。

合作組的首席研究員、紐約洛克菲勒大學遺傳學家Erich Jarvis說:“我們的目标是了解平均97%的人類等位基因多樣性。”作為脊椎動物基因組項目(Vertebrate Genomes Project)的主席,Jarvis還希望通過這些完整基因組的組裝能力,獲得地球上每一種脊椎動物的完整基因序列。他說:“我相信在未來10年内,端粒到端粒的基因組組裝将是一種常态。”

2 蛋白質結構解析

結構決定功能,但鑒定結構卻很難。在過去的兩年裡,實驗與計算方面的進步提供了更多的趁手工具,讓研究人員能以空前的速度和分辨率解析蛋白質的結構。

AlphaFold2結構預測算法由位于倫敦的谷歌子公司DeepMind開發,它能依靠“深度學習”政策,從折疊蛋白質的氨基酸序列推斷其形狀[5]。在2020年的蛋白質結構預測大賽CASP上,計算生物學家同台競技,比拼各自的蛋白質結構預測算法,但最終AlphaFold2所向披靡,知名度和普及率也一路飙升。

歐洲生物資訊研究所進階科學家、前所長Janet Thornton說:“AlphaFold2對某些結構的預測可以說好得出奇。”自去年7月對外公開以來,AlphaFold2已被應用于蛋白質組學研究,以确定人類[6]和20種模式生物表達的所有蛋白質的結構(見Nature 595, 635; 2021;颠覆生命科學!AlphaFold預測完整人類蛋白質組結構),并用來鑒定Swiss-Prot資料庫中近44萬種蛋白質的結構,大大增加了擁有高置信度模組化資料的蛋白質數量。AlphaFold2的算法也證明了它具有解析多鍊蛋白質複合物的能力[7]。

與此同時,冷凍電鏡(cryo-EM)的更新換代也使研究人員能用實驗方法來對付那些最棘手的蛋白質及其複合物。冷凍電鏡利用電子束掃描快速當機的分子,從多個角度生成蛋白質的圖像,再通過計算将這些圖像重新組裝成一個3D結構。2020年,冷凍電鏡的軟硬體得到更新後,兩個團隊獲得了1.5埃以下的結構分辨率,确定了單個原子的位置[8,9]。

紐約結構生物學中心西蒙斯電鏡中心聯合主任Bridget Carragher說:“在那之前,雖然我們動不動就說什麼‘原子分辨率’,但那都隻能算是接近原子水準,而這才是真正的原子水準。”Carragher說,盡管兩個團隊使用的都是脫鐵鐵蛋白這種經過充分研究的模式蛋白,但他們的研究表明,對于其他更難的目标,達到近原子分辨率也是可行的。

《自然》榜單:有望改變2022年科學程式的7大前沿技術

來自冷凍電鏡的圖像能幫助解析複雜的結構 | Paul Emsley/MRC分子生物學實驗室

許多最初對AlphaFold2将信将疑的實驗學家,現在也把它看作是對冷凍電鏡這類實驗方法的有效補充。AlphaFold2的計算模型可以幫助資料分析和重建,而冷凍電鏡則能發現目前還無法用計算機預測的結構。比如Carragher團隊就在使用“時間分辨”(time-resolved)冷凍電鏡捕捉蛋白質與其他分子互相作用時的快速構象變化。她說:“我們可以讓變化定格,看到100毫秒的時間裡究竟發生了什麼。

另一種相關技術名為冷凍電子斷層掃描(cryo-ET),這種方法可以捕捉到冷凍細胞薄切片中自然發生的蛋白質行為。但是,這些紛繁複雜的圖像解讀起來非常難。Carragher認為,機器學習領域在計算能力上的進展将是不可或缺的。她問道:“不然還能如何解決這些幾乎無法解決的問題呢?”

3 量子模拟

原子肯定都是原子尺寸的。但在正确的條件下,原子能處于高度激發态,直徑變為1微米或更大。通過對數百個原子精心排列的陣列進行可控激發,實體學家證明了他們可以解決很有挑戰的實體學問題,進而超越傳統計算機的極限。

量子計算機以量子比特為機關處理資料。量子比特通過名為糾纏(entanglement)的量子力學現象耦合在一起,進而在一定距離内互相影響。相對于經典計算機中相同數量的比特,這些量子比特可以顯著提高算力。

多個團隊已經成功利用單個離子作為量子比特,但它們所帶的電荷使之難以進行高密度組裝。法國國家科學研究中心(CNRS)的Antoine Browaeys和哈佛大學的Mikhail Lukin等實體學家正在研究另一種方法。他們的團隊使用光學鑷子将不帶電原子精确固定在緊密排列的2D和3D陣列中,然後用雷射将這些粒子激發成大直徑的裡德堡原子(Rydberg atom),使其與附近原子糾纏[10,11]。南韓科學技術院的實體學家Jaewook Ahn解釋道,“裡德堡原子系統是獨立可控的,它們的互相作用可以打開和關閉。”這反過來又賦予了其可程式設計性。

這種方法在短短幾年裡就大放異彩,技術進步讓裡德堡原子陣列的穩定性和性能雙雙得到提升,量子比特的數量也從幾十個迅速擴充到幾百個。雖然該技術的早期應用主要集中在已經提出的問題上,如材料性能的預測,但它的用途非常廣泛。Browaeys說:“目前為止,理論學家提出的任何理論模型都有其實作方法。”

該領域的先鋒人士已經成立了公司,目前正在開發供實驗室使用的裡德堡原子陣列系統,Browaeys預計這種量子模拟器将在一兩年内投入商用。這項工作也為量子計算機的廣泛應用鋪平了道路,包括在經濟學、物流和加密領域的應用。研究人員還無法确定這項創新技術在計算領域中的地位,但Ahn将其比作萊特兄弟在航空領域的早期摸索。他說:“第一架飛機毫無交通優勢可言,卻改變了整個世界。”

4 精确基因組調控

盡管CRISPR-Cas9技術擁有驚人的基因組編輯能力,但它更适用于讓基因失活而非基因修複。這是因為Cas9酶靶向基因組序列雖然還算精準,但細胞對随後雙鍊切割的修複卻并不精準。CRISPR-Cas9修複通常由一種稱為非同源末端連接配接(non-homologous end-joining)的過程介導,經常會混入小片段插入或缺失的問題。

哈佛大學化學生物學家劉如謙(David Liu)指出,大多數遺傳疾病需要的是基因修正而非基因破壞。劉如謙和他的團隊已經為此開發了兩種很有前景的方法。這兩種方法都利用了CRISPR精準的靶向能力,同時限制了Cas9在該位點切割DNA的能力。

第一種方法叫做堿基編輯(base editing),能将催化受損的Cas9與一種酶結合,這種酶能将一種核苷酸轉化為另一種——例如将胞嘧啶轉化為胸腺嘧啶,或是将腺嘌呤轉化為鳥嘌呤(參見Nature https://doi.org/hc2t; 2016;CRISPR技術又上一層樓!現在可以編輯DNA單個堿基了)。不過,目前隻有特定的堿基-堿基轉換可以使用這種方法實作。

第二種方法是引導編輯(prime editing),也是該團隊最新的研究成果,能将Cas9與逆轉錄酶聯系起來,并使用一種經過修改的向導RNA,這種向導RNA可以将所需的編輯内容整合到基因組序列中(見Nature 574, 464–465; 2019;基因編輯研究又下一城:更精準的CRISPR工具面世)。經過一個多階段的生化過程,這些成分将向導RNA複制到最終取代目标基因組序列的DNA中。

重點是,堿基編輯和引導編輯都隻剪切一條DNA鍊,這對細胞來說是一個更安全、破壞性更小的過程。

2016年首次報道的堿基編輯正在走向臨床應用:劉如謙在美國坎布裡奇市創立的Beam Therapeutics公司在11月獲得了美國食品藥品監督管理局(FDA)的準許,允許其在人體内首次試驗該技術,用于修複導緻鐮狀細胞病的基因。

雖然引導編輯的出現時間還不久,但它一直在更新換代,發展前景也很明朗。首爾延世大學醫學院的基因組編輯專家Hyongbum Henry Kim和他的團隊證明,使用引導編輯修正小鼠的視網膜基因突變,可以達到16%的有效率[12]。他說:“如果我們使用最新報道的更先進的版本,效率還會得到更大的提升。”劉如謙團隊還發現,引導編輯可以幫助将基因尺寸大小的DNA序列插入基因組,有望成為一種更安全、更嚴格可控的基因療法[13]。劉如謙說:“雖然這個方法的有效率不算高,但即使是很少的修複,也可以大有裨益。在某些情況下,如果你能以10%甚至1%的有效率替換一個基因,這種病就有救了。”

5 靶向基因療法

基于核酸的藥物可以在臨床上産生重大影響,但它們可應用的組織仍有諸多限制。大多數藥物要麼隻能局部給藥,要麼需要從患者體内提取細胞進行體外處理後,再移植回去。但有一個例外——肝髒。肝髒可以過濾血液,經證明是選擇性藥物遞送的可靠靶點。這種情況下,靜脈注射甚至是皮下注射都可以使用。

麻省理工學院化學工程師Daniel Anderson說:“當你認真思考這個問題時,單單是把藥物遞送到任何組織這件事就夠難的。我們的身體天生就善于使用已有的遺傳資訊,不喜歡接受外來者。”不過,研究人員正在開發一些政策,可以引導藥物進入特定器官系統,而不影響其他非靶點組織,這些工作正取得穩步進展。

腺相關病毒是許多基因療法的首選載體,動物研究也表明,仔細挑選合适的病毒再加上組織特異性基因啟動子,就能實作局限于特定器官的高效藥物遞送[14]。然而,病毒有時難以大規模生産,還會調動免疫應答,破壞療效或産生不良反應。

脂質納米粒是一種非病毒載體,過去幾年發表的多項研究展示出對其特異性進行調控的潛力。例如,美國德克薩斯大學西南醫學中心生物化學家Daniel Siegwart等人開發的選擇性器官靶向(SORT)方法能幫助快速合成和篩選脂質納米粒,找出能有效靶向組織(如肺或脾髒)細胞的納米粒[15]。

荷蘭埃因霍溫理工大學生物醫學工程師Roy van der Meel說:“這是最早的其中一篇論文,它表明如果對這些脂質納米粒進行系統篩選,并改變它們的組成,就能擾亂其生物分布。”Anderson說,許多團隊也在研究如何利用蛋白質成分(如細胞特異性抗體)協助這一靶向過程。

Anderson對Beam Therapeutics和Intellia等公司在靶向骨髓中血液和免疫細胞前體上取得的臨床前進展尤為興奮,這兩家公司都在使用經過特殊設計的脂質納米粒。他說,如果能成功靶向這些組織,患者就能擺脫目前體外基因療法帶來的痛苦,包括在移植前用化療殺死現存的骨髓細胞。Anderson說:“把這些任務放到體内完成或将徹底改變治療的概念。”

6 空間多組學

2016年,瑞典皇家理工學院研究員Joakim Lundeberg上司的團隊設計了一種政策來解決上述問題。該團隊用條形碼寡核苷酸(barcoded oligonucleotide)——RNA或DNA短鍊——制備載玻片,這些條形碼寡核苷酸可以從完整的組織切片中捕獲信使RNA,這樣每個轉錄本就能根據其條形碼對應到樣本中的特定位置。Lundeberg說:“之前沒有人相信我們真的能從一個組織切片進行全轉錄組的分析,但結果證明這非常簡單。”

自此,空間轉錄組學領域迎來了大爆發。目前已有多種商用系統問世,包括10x Genomics公司使用Lundeberg的技術開發的Visium Spatial Gene Expression平台。許多學術研究團隊也在研發新的方法,用更好的深度和空間分辨率來繪制基因表達圖譜。

《自然》榜單:有望改變2022年科學程式的7大前沿技術

CRISPR-Ca9基因編輯複合物使用一個向導RNA(紅色)切割DNA(藍色)。來源:Mulekuul/SPL

現在,研究人員正在他們的空間圖譜上疊加組學資料。例如,耶魯大學生物醫學工程師Rong Fan就開發了一個名為DBiT-seq16的平台,該平台采用微流控系統,可以同時為數千個mRNA轉錄本和以标記寡核苷酸抗體作為标簽的數百個蛋白質生成條形碼。

與隻使用轉錄組資料相比,這對細胞基因表達如何影響蛋白質生成和活性的問題能夠給出更準确的評估,而且Fan的團隊一直在用它研究免疫細胞激活等過程。他說:“我們看到了皮膚免疫細胞如何應對Moderna新冠疫苗的早期迹象。”一些商用系統也可以在獲得轉錄組資料的同時從多種蛋白質擷取空間資料,包括這裡的Visium平台和Nanostring的GeoMx系統。

同時,Lundeberg的團隊也改進了他們的空間轉錄組學方法,以同時捕獲DNA序列資料。這使得他的團隊能夠開始繪制惡性良性腫瘤發生背後的時空事件。他說:“我們可以追蹤這些基因的空間變化,看看它們如何演化出額外的基因變異,最終導緻惡性良性腫瘤。”

Fan的團隊已經示範了如何對組織樣本中染色質修飾進行空間定位,這可以揭示影響發育、分化和細胞間通訊等過程的細胞基因調控[17]。Fan相信這種方法可以與RNA甚至蛋白質的空間分析相結合。他說:“我們的資料初步顯示,這是可以做到的。”

7 基于CRISPR的診斷

CRISPR-Cas系統精确切割特定核酸序列的能力,源于它作為細菌“免疫系統”對抗病毒感染的作用。這一聯系激發了最早使用這項技術的研究人員去思考其對病毒診斷的适用性。麻省理工學院-哈佛大學博德研究所的遺傳學家Pardis Sabeti說:“發揮它們與生俱來的功能很正确,畢竟它們已經演化了幾十億年。”

但并不是所有的Cas酶都是一模一樣的。Cas9是CRISPR基因組操作的首選酶,但基于CRISPR診斷的大部分研究使用的都是Cas13這種靶向RNA分子家族,該家族由博德研究所的分子生物學家張鋒及其團隊在2016年首次發現。

加州大學伯克利分校的Jennifer Doudna解釋道,“Cas13利用其RNA向導通過堿基配對來識别RNA靶點,并激活核糖核酸酶活性,這種活性可通過報告RNA作為診斷工具加以利用。”Doudna與目前供職于馬克斯·普朗克病原體科學研究所的Emmanuelle Charpentier因開發CRISPR-Cas9的基因組編輯能力而共同榮膺2020年諾貝爾化學獎。這是因為Cas13不僅會切割向導RNA靶向的RNA,它還會對附近的所有其他RNA分子進行“旁系切割”(collateral cleavage)。許多基于Cas13的診斷使用一個報告RNA,将熒光标記拴在抑制熒光的淬滅分子上。

當Cas13在識别病毒RNA後被激活時,它會切斷報告基因并從淬滅基團釋放熒光标記,産生可檢測的信号。有些病毒會釋放很強的信号,可以在不擴增的情況下檢測到,大大簡化了即時診斷(point-of-care diagnostics)。例如,去年1月,Doudna和舊金山Glastone病毒學研究所的Melanie Ott示範了一種基于鼻拭子的CRISPR-Cas13快速檢測方法,可使用手機攝像頭對新冠病毒(SARS-CoV-2)進行無擴增檢測[18]。

RNA擴增可以提高對微量病毒序列的靈敏度,Sabeti和她的同僚已經開發了一種微流控系統,利用從僅僅幾微升樣本中擴增出的遺傳物質,就可以同時篩查多種病原體[19]。她說:“目前,我們有一種同時檢測21種病毒的方法,每個樣本的成本還不到10美元。”她還表示,他們已經開發出了基于CRISPR檢測的工具,可以同時檢測169種以上的人類病毒。”

Doudna表示,其他Cas酶有望繼續擴充這個診斷工具箱,包括Cas12蛋白,這種蛋白擁有與Cas13相似的特性,但其目标是DNA而非RNA。這些酶可以讓檢測病原體的範圍更廣,甚至可以快速診斷其他非傳染性疾病。Doudna說:“如果你能提高速度,那将非常有用,特别是考慮到現在不同的癌症亞型已經開始按照特定類型的突變進行分類。”

參考文獻

[1]Nurk, S. et al. Preprint at bioRxiv https://doi.org/10.1101/2021.05.26.445798 (2021).

[2]Miga, K. H. et al. Nature585, 79–84 (2020).

[3]Logsdon, G. A. et al. Nature593, 101–107 (2021).

[4]Gershman, A. et al. Preprint at bioRxiv https://doi.org/10.1101/2021.05.26.443420 (2021).

[5]Jumper, J. et al. Nature596, 583–589 (2021).

[6]Tunyasuvunakool, K. et al. Nature596, 590–596 (2021).

[7]Evans, R. et al. Preprint at bioRxiv https://doi.org/10.1101/2021.10.04.463034 (2021).

[8]Nakane, T. et al. Nature587, 152–156 (2020).

[9]Yip, K. M., Fischer, N., Paknia, E., Chari, A. & Stark, H. Nature587, 157–161 (2020).

[10]Bernien, H. et al. Nature551, 579–584 (2017).

[11]Barredo, D., Lienhard, V., de Léséleuc, S., Lahaye, T. & Browaeys. A. Nature561, 79–82 (2018).

[12]Jang, H. et al. Nature Biomed. Eng. https://doi.org/10.1038/s41551-021-00788-9 (2021).

[13]Anzalone, A. V. et al. Preprint at bioRxiv https://doi.org/10.1101/2021.11.01.466790 (2021).

[14]Levy, J. M. et al.Nature Biomed. Eng. 4, 97–110 (2020).

[15]Cheng, Q. et al.Nature Nanotechnol.15, 313–320 (2020).

[16]Liu, Y. et al. Cell 183, 1665–1681 (2020).

[17]Deng, Y. et al. Preprint at bioRxiv https://doi.org/10.1101/2021.06.06.447244 (2021).

[18]Fozouni, P. et al. Cell184, 323–333 (2021).

[19]Ackerman, C. M. et al. Nature582, 277–282 (2020).

原文作者:Michael Eisenstein

原文以Seven technologies to watch in 2022為标題發表在2022年1月25日《自然》的技術特寫上

nature

版權聲明:

2022 Springer Nature Limited. All Rights Reserved

如果想了解更多産業界和科技創投資訊,

歡迎關注果殼硬科技

《自然》榜單:有望改變2022年科學程式的7大前沿技術

繼續閱讀