澎湃新聞記者 張慧

論文網頁截圖
日前,國際權威學術期刊《遺傳學和基因組學雜志》(Journal of Genetics and Genomics)線上發表了中國科學院院士、複旦大學教授金力團隊題為《華表計劃:5000名漢族個體的全外顯子測序》(“The HuaBiao Project: Whole-Exome Sequencing of 5,000 Han Chinese Individuals”)的研究論文。
該研究對來自中國華北(鄭州)、華東(泰州)、華南(南甯)三個代表性漢族群體的5000名個體進行了基因組全外顯子測序,初步建構了“華表”中國外顯子組資料庫(以下簡稱“‘華表’資料庫”)。
8月30日,在“華表計劃”最新科研成果通氣會上,論文通訊作者之一、複旦大學人類遺傳學與人類學系主任王久存教授、複旦大學人類表型組研究院教授石樂明介紹科研成果情況。
發現本土人群特有的基因組變異
包括疾病在内的各類健康問題,受基因組遺傳變異的顯著影響。這種遺傳變異不僅僅因人而異,往往也因“人群”而異。
2001年,人類基因組計劃建構了第一個人類參考基因組;2008年,千人基因組計劃啟動,對全球不同人種的2500例樣本進行全基因組測序,繪制完成迄今最為詳盡的人類基因組變異圖譜。通過千人基因組計劃,科學界發現:不同人種(人群)間基因組變異位點及頻率存在顯著差異。
與此同時,新一代基因組測序技術的快速發展與成熟,使得在基因組水準對人群樣本進行大規模測序研究,并系統揭示人群的精細遺傳結構已經成為可能。外顯子是真核生物基因的一部分,負責編碼蛋白質;外顯子組是基因組的蛋白質編碼區域的集合。與全基因組測序相比,新一代覆寫基因組編碼區的全外顯子組測序(whole-exome sequencing, WES)技術成本大幅降低。可在高測序深度情況下,更準确檢測出臨床緻病的罕見變異位點。
目前,國際上已有多個大型公共全外顯子(WES)資料庫,如ExAC、gnomAD等。但這些資料庫的樣本大多由高加索、非洲裔美國人或拉丁美洲人組成,中國漢族樣本數量有限。作為世界上人口最多的民族,漢族具有較高的遺傳多樣性,建立一個高品質且有代表性的中國漢族人群全外顯子資料庫對于生物醫學研究具有極為重要的價值。
2017年9月,複旦大學現代人類學教育部重點實驗室聯合有關機構發起“華表計劃”——中國全外顯子組資料庫項目,是自主建設的中國人群公共資料庫之一。作為“華表計劃”的主要科學設計者,金力表示,“華表計劃”第一階段的建設目标是通過對覆寫全國、有代表性的漢族人群樣本進行高品質測序,系統解析外顯子區域等位基因頻率,精細刻畫中國漢族人群遺傳結構,形成我國自主建設的中國人群基因組資料庫。同時,在遵循國家人類遺傳資源管理有關規定的前提下,探索推動包括基因組資料在内的各類生物醫學資料的保藏與共享,為下一步的精準醫學研究提供參考資料集。
經過近四年時間,複旦大學團隊聯合艾吉泰康采用全外顯子捕獲晶片技術,完成了對5000例中國漢族個體的全外顯子捕獲和測序,建構起“華表”資料庫,完成了“華表計劃”第一階段目标。
目前,“華表”資料庫共包含207萬個遺傳變異,其中46.4%的遺傳變異為該研究首次發現。全球研究人員都可以通過布設在中國生物醫學大資料中心(上海)網站下的資料庫子站(https://www.biosino.org/wepd)快速檢索相關遺傳變異的頻率資訊。
“華表”資料庫為罕見病精準診療提供科學基礎
華表資料庫中的樣本,均與由複旦大學人類表型組研究院教授石樂明團隊原創研發的“中華家系一号”生物标準物質(http://chinese-quartet.org/)進行了比較驗證,結果顯示,“華表”标準品遺傳資料SNP精度(precision)達到99%。
科研人員還将“華表”樣本與同樣本另一種技術路線——全基因組晶片資料進行比較,結果顯示一緻率達到99.8%。
而“華表”資料庫與gnomAD(東亞人群)中共有遺傳位點比較,兩者頻率高度一緻(R2>0.99)。
上述結果均證明“華表”資料庫變異資料具有高品質和高準确性。
論文通訊作者之一、複旦大學人類遺傳學與人類學系主任王久存教授介紹,包括全外顯子組資料庫在内的人群資料庫對生物醫學界開展罕見病研究具有重大意義。罕見病是指僅在極少數人身上發生、人群患病率小于萬分之一的稀罕病症。統計表明,大部分(72%)罕見病是遺傳性疾病,許多罕見病在患者生命早期發病,例如地中海貧血、成骨不全症等。
“華表”資料庫提供了中國漢族人群的低頻位點頻率資訊,能夠幫助研究人員區分罕見緻病突變和高頻良性變異,進而為進一步精準識别和分析中國人所患罕見病的緻病分子機制、遺傳機理以及基于此的罕見病精準診療方案提供了科學基礎。據介紹,一般來說人群越大,産生的選擇壓力就越大,越容易清除有害基因突變。由于漢族人群很大,是以受罕見病影響相對于封閉的小群體要小。
複旦大學博士研究所學生郝萌、博士後濮偉霖、青年副研究員李轶和文少卿為該論文的共同第一作者,複旦大學教授金力、王久存、李輝和青年副研究員王一為共同通訊作者。相關工作得到上海市科技重大專項、中國醫學科學院醫學科學創新基金和國家重點基礎研究發展計劃的支援。
責任編輯:高文
校對:徐亦嘉