夢晨 發自 凹非寺
量子位 | 公衆号 QbitAI
人類基因組測序迎來新的裡程碑!
首個完整無間隙人類基因組測序,由近百位科學家合作完成,填補上最後8%的空缺。
最新一期Science罕見地以特刊形式連發6篇論文,另外兩篇介紹研究方法的論文同日登上Nature Method。
作者之一、華盛頓大學教授Evan Eichler稱:
我們在生命天書中讀到了前所未有的新章節。
回看2003年,人類基因組計劃(Human Genome Project)首次完成92%的人類基因測序,創造了曆史。
到如今,新成立的端粒到端粒聯盟(T2T Consortium)填補上最後8%的空缺,同時糾正了之前的一些錯誤,也将載入史冊。
△T2T聯盟部分成員
新确認的8%DNA片段裡包含重要的免疫反應基因,它們幫助人類适應和抵禦病毒和細菌感染,在預測藥物反應方面很有價值。
聯盟發起人之一、馬裡蘭大學的Adam Phillippy認為,個人基因組測序在10年内有望普及,個性化醫療成本會大幅下降。
另外新發現的基因中有一些使得人類大腦比其他靈長類動物大腦更大,有助于進一步揭開人類進化之謎。
攻克最後的8%
當初的人類基因組計劃由6國近2000位科學家耗時13年完成,最後遺留的8%靠當時的測序技術難以突破。
原因有二:
其一,最後的8%裡有很多片段是重複的。
科學家們用拼圖來形容這一困難。如果拼圖裡好多小塊很相似就更難找到正确的位置。
近幾年發展出的新測序方法Oxford Nanopore和PacBio HiFi可以一次處理更長的DNA片段,就好像拼圖的塊變大,塊數變小了。
其二,很難找到隻有一套DNA的人類細胞。
正常細胞同時擁有兩套DNA,分别來自父親和母親,測序時兩組DNA混在一起增加了難度。
這次的解決辦法是使用一組來自“葡萄胎”的細胞,這是一種罕見妊娠疾病,使胚胎細胞異常生長,隻保留一套DNA。
用上新方法,人類DNA序列中30.55億個堿基對的測序工作終于宣告完工。
人類基因組計劃前負責人Robert Waterston對新方法評價到:
(人類基因組)不再有任何隐藏的或未知的部分。
全新的人類參考基因組被命名為T2T-CHM13,今後的個性化基因測序可以此為基準,鎖定病變基因,提前預防和治療。
這次研究成果幾個月前已釋出在生物預印本平台,現在正式見刊Science。
具體到已發表的内容上,還存在一點不足之處:
使用的葡萄胎細胞保留的是XX染色體,缺失了Y染色體。
不過後來這段時間科學家們也沒閑着,Y染色體的測序工作其實也另外完成了。
項目負責人Adam Phillippy在社交媒體宣布了這一消息,人體24條染色體基因測序已全部完成。
最新參考序列T2T-CHM13 v2.0的完整資料和線上浏覽器已公開,可供全球研究團隊使用。
而最新包含Y染色體測序成果的論文預印版計劃在下個月釋出。
論文位址:
https://www.science.org/toc/science/376/6588
CHM13 v2.0相關資料和工具
https://genomeinformatics.github.io/CHM13v2/