天天看點

進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?

作者:果殼網科普

來源:lizimo 我是建設者

在隊列研究和生物樣本庫建設上,似乎還沒有一套行之有效的中國解決方案。在南京醫科大學和因美納最近聯合舉辦的隊列研究和精準醫學論壇上,國内外的多位專家分享了隊列研究的探索經驗,引人思考。中國到底需要什麼樣的隊列研究,謹以本文抛磚引玉。

進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?

由南京醫科大學和因美納聯合舉辦的“2023 隊列研究及精準醫學轉化學術論壇”活動現場

空氣污染和抽煙哪個對人的健康影響更大?為什麼有些人不抽煙也容易得癌症?諸如此類的問題經常在現實生活中被問及。

近年來,科學研究揭示了影響健康的諸多因素,預防變成健康生活的一大關注點。然而,個體間還有很大的差異。随着精準醫療的全社會關注度的提高,關于我們的基因與環境、生活方式的相關作用的了解也越來越多被提及。

但到底是什麼維持了我們的健康,又是哪些因素增加了我們的患病風險。回答這些問題并非朝夕之功,但這背後可能都離不開長期的隊列研究和相應的生物樣本庫的貢獻。

一、什麼是隊列研究?為什麼需要生物樣本庫?

隊列,英文cohort,本意指的是具有相同特征或者相同暴露的人群。對這群人的研究就構成了隊列研究的主題,随着時間的推移不斷跟蹤關注這群人的情況。

當入組隊列研究的對象加入研究時,研究方會收集他們的基本資訊,如人口統計資料、年齡和種族特征等,可能還收集生物的、社會的、心理的、醫療的、環境的、遺傳的資訊,這些構成了研究的基線。研究人員也會在參與者之後生活的不同階段定期收集研究對象的疾病發病或者健康狀況資訊,這就是所謂的随訪。根據研究的目标,随訪可能持續幾周或數年。

将随訪點的資料與基線進行比較,可以前瞻性評價不同因素如何影響人的健康。在流行病學中,經常利用隊列研究來識别導緻疾病或影響疾病模式發展的潛在風險因素,如空氣污染、抽煙、新冠病毒等等。自1940年起,以美國弗萊明翰心髒研究(Framingham Study)、英國醫生隊列(British Doctors Study)為代表的隊列研究紛紛開始建設,為心腦血管疾病、惡性良性腫瘤等慢性非傳染性疾病的風險認知與防治奠定了基礎。

進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?

隊列研究與生物樣本庫的關系示意圖

生物樣本庫則是為不同隊列研究而收集存儲的生物樣本及其附屬資訊的集合。傳統上,生物樣本庫是服務所要開展的研究而設立的;但越來越多地,研究人員意識到,一個建設完整且系統的生物樣本庫可以為更多的研究群體所使用,指導、啟發并滿足他們多樣化的研究需求,于是很多樣本庫是前瞻性地從頭開始設計的。

是以,生物樣本庫建構的目标群組織管理機構各不相同,比如以特定疾病隊列為導向的樣本庫多是通過醫院來收集,而基于人群的前瞻性大規模隊列則需要從自然人群中采集樣本,也需要更大的資金、資源群組織形式來推動。

不管是社群為基礎的前瞻性自然人群隊列研究還是醫院為基礎的專病隊列研究,生物樣本庫建設樣本量越來越大,因為大多數風險因素對個體健康結局隻有适度或很小的影響,隻有通過更大規模的群體研究,這些因素的影響才會展現出統計上客觀可靠的結果。

進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?

英國生物銀行首席研究員兼首席執行官Rory Collins教授在演講中經常提到的一個例子:如圖所示,在5千、5萬、50萬人群中所呈現的冠心病風險與收縮壓水準之間關系,随着樣本量的增加,不同分組的變化趨勢逐漸清晰一緻。

在全球範圍内,建立人群生物樣本庫都得到了各國政府的支援。大規模、高品質的生物樣本庫建設已經成為基礎設施發展的關鍵領域,成為現在醫學研究的重要資源。大型前瞻性縱向隊列設計和生物樣本收集相結合這一趨勢正越來越多地被采納,例如英國生物樣本庫(UK Biobank, UKB)、美國精準醫學計劃(All of Us)、日本生物樣本庫(Biobank Japan)、新加坡精準醫學計劃(Precision Health Research, Singapore, PRECISE)等等。

二、100美元基因組時代的生物樣本庫及隊列研究

雖然有環境、生活方式等諸多因素的綜合影響,但健康個體之間的差異最終反映在分子代謝水準上的差異。得益于基因晶片、高通量基因測序等技術突飛猛進的發展,遺傳學及基因組學資訊率先被大規模地用于隊列研究。

雖然基因的單一缺陷會造成明顯的疾病(或稱罕見病),但這隻占少數部分,大多數疾病如慢性病等盡管也與遺傳因素有關,但涉及到多個基因上的多種變化的累積效應。随着人類基因組計劃的開展,結合基因型和表型資料進行全基因組關聯研究(GWAS)或多基因風險評分(PRS)或全表型組關聯研究(PheWAS)變得更加可行。我們可以對個體進行基因資料的生成,與個體訪談、身體評估、病史回顧或其他一些生化檢查提供的表型及臨床資料相關聯,以此來探究可能的遺傳效應及影響。

自2002 年發表關于心肌梗塞的第一個成功的 GWAS 研究以來,GWAS 研究不斷增長,從中獲得的見解對疾病研究也産生了巨大影響。然而,這些關聯的效應量通常較小,需要大量群體才能達到統計顯着性。另外,關聯研究也隻建立相關性,而不是因果關系,是以在 GWAS 後必須進行詳細的分子生物學研究,來牢固地建立性狀的真正分子機制。

進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?

曼哈頓圖經常被用來描繪了密切相關的風險位點。每個點代表一個SNP,X 軸顯示基因組位置,Y 軸顯示關聯水準。此示例取自一項調查腎結石疾病的 GWAS 研究,是以峰值表明在腎結石患者中更常見的遺傳變異。

近年來,全基因組測序(WGS,Whole Genome Sequencing)迅速崛起,通過檢測整個基因組,WGS提供了每個個體最全面的基因序列資料集,補充和增強了基因晶片分型(Genotyping)和全外顯子組(WES,Whole Exome Sequencing)的資料。随着測序成本的顯著下降并步入100美元的範疇,在有限的預算範圍内可對更多的樣本進行WGS測序,結合生物資訊學分析及變異注釋解讀的進步,可以實作新基因、新見解的快速發現(特别是基因組的非編碼區域),這無疑将推動人類基因組學研究的下一波進展。

大規模人群的遺傳及基因組學分析可以加強對疾病風險和病因學的認知,比如心血管代謝疾病領域的PCSK9、ANGPTL3、Lp(a)等風險基因及非酒精性脂肪性肝炎上的CIDEB、HSD17B13、PNPLA3等,進一步支援對疾病發展更好的病理生理學了解,幫助開發相應的治療藥物(上述的這幾個靶點都已經有藥物上市或在臨床階段)。

到現在為止,GWAS依然是破譯遺傳學和複雜性狀之間錯綜複雜關系的重要工具,成為改進醫療保健政策和靶向治療的基石。截至2023年9月10日,GWAS目錄包含了6566篇已發表文章、552116個強關聯位點和65590個完整的統計學資料。

三、為什麼說UKB是生物樣本庫服務隊列研究的典範?

在生物樣本庫持續建設并推動高品質科學研究的典型案例中,英國生物樣本庫UKB一定是最值得關注的。

UKB于2006年開始招募,在四年後達到了50萬人的招募目标(相當于每1000個英國人中約有7個人自願參與了這個項目)。UKB專注于 40 到 69 歲的健康志願者,這些參與者被采集了血液和尿液,身體被掃描成像,要求填寫自己習慣和生活方式的調查問卷,并同意項目長期随訪。是以,除了相應的生物樣本之外, UKB多年來已經收集了一個活的資訊庫。對每個參與者進行的每項測試的資訊都與他們的所有其他測試結果相關聯,是以UKB在深度和廣度上不斷增長。

進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?
進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?

UKB資料的廣度和深度

UKB項目是英國科學家在呼籲政府投資DNA的背景下推動成立的,是以項目一開始就希望對參與者進行基因序列的分析。通過定制的基因晶片,UKB在 2015 年 5 月提供了第一批15萬名參與者的基因分型資料,兩年後釋出了全部50萬人的結果。随着測序技術的不斷進步,UKB也不斷跟進,先後完善并補充對50萬人的WES及WGS測序覆寫。在2022年7月向研究人員提供了 47萬名參與者的WES資料,在2021年11月推出了前 20萬名參與者的WGS資料,剩餘的30萬WGS資料也将在 2023 年底釋出。

進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?

存儲的樣本最終可能會耗盡,但生成的數字資訊不會。除了基因資料的不斷補充之外,UKB也在持續疊加關聯其他的資料類型,包括單細胞轉錄組、蛋白組(起初集中在1500種蛋白,後面逐漸擴充到3000種)、代謝組(包括250種左右到脂質及一些氨基酸)、影像(到2024年要對其中的十萬參與者進行核磁共振成像MRI,包括腦、心髒、骨骼等)。随着不同測量技術的應用,UKB每個樣本的資訊量得到了最大程度的釋放,這也為持續的關聯分析、不同緯度的關聯驗證及拓寬可能的表型譜分析打好了基礎。

UKB在規模(50萬參與者隻有約1000人後來退出)、深度(廣泛的資料類型)、持續時間(15年随訪為持續健康研究提供了大量的資料支撐)等方面都提供了可參考的經驗。但UKB的成功并不局限于此。

在生物樣本庫建構上,UKB摸索了公私合作(Public-Private-Partnering)的可參考的成功模式。比如在WES及WGS的測序上,UKB都選擇與多家藥企合作,除了英國政府提供的資金外,這些合作的藥企也共同資助了相應測序項目的開展。藥企通過投資共享測序項目所帶來的資料挖掘及使用權益,包括再生元公司在内的藥企已經通過這樣大規模的WES分析發現了多個新藥靶點,如GPR75作為肥胖治療靶點,這為後續創新藥物發現及開發提供了充分的支撐和儲備。

UKB所有參與者的基因資料可供準許的研究人員使用,研究者可以通過UKB最近聯合DNAnexus推出的研究分析平台(UK Biobank’s Research Analysis Platform)擷取這些資料和資料分析處理工具。DNAnexus部署在倫敦的亞馬遜雲上,保證了安全及可審計的接入和資料擷取;而對于早期及中低收入國家的研究人員,UKB則提供免費的計算資源。這消除了大規模、多模式資料所帶來的計算負擔,提升了研究群體擷取資料并從中識别遺傳發現的機會。

這種資料共享促成了廣泛的研究開展和新發現。UKB的使用者涵蓋全球範圍内近100個國家的超3萬名注冊研究人員(80%的研究申請來自于英國外的研究者);截止2022年底,使用UKB資料已發表的科學論文近6000篇,引用超18萬次,并以每年上千篇的速度增加。

進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?

UKB注冊研究人員及其所發表的文章數量近年來穩步增長

生物樣本庫的真正價值在于資料,諸如UKB這樣的基礎資料資源可以供全球各地的研究人員所使用。這種“開放共享”之是以能發揮其最大價值,是因為在這個過程當中資料快速疊代——全球科學家不斷地進行使用(輸出)和貢獻(輸入),這促進了新見解的産生,累積形成科研的“大資料”并不斷重新整理疊代向前。科學本質上就是踩在别人的肩膀上持續攀登。最終,參與者可以從高品質的健康研究中直接獲益,研究人員可以發表具有影響力的成果,而公私合營可以産生足夠的機會去考慮成果轉化,這樣一來,不同群體在同一個隊列樣本庫上的持續建設使得生物樣本庫的價值實作了最大化。

進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?

UKB的成功因素總結

通過這樣的方式,UKB建構了英國迄今以來規模最大的有關緻病或預防疾病的基因和環境因子的資訊資源庫,也逐漸成為了全球為數不多的大規模人體生物健康資訊庫之一,并在全球科學研究及産業轉化中持續發揮着影響力。

四、中國到底需要什麼樣的隊列研究?

UKB為我們開展隊列研究及生物樣本庫建設提供了模式的參考,但西方國家的經驗從來都不能直接解決國内的問題,在生物樣本庫建設上也不能完全拿來主義。

進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?

專家學者在國内隊列研究及生物樣本庫建設上經常提及的幾個挑戰因素

包括基因測序資料在内的國外生物樣本庫主要由來自歐洲血統的個體樣本組成的,生物樣本庫收集樣本時需要多樣化才能展現出人群之間的差異性,研究人員也應考慮人群代表性不足這一因素對于其研究可能的限制及影響。在國内,我們是一個由56個民族組成的人口大國,人類遺傳資源的多樣性進一步豐富,這可能是任何一個國家都無法比拟的。同時,大陸地域遼闊,人口分布較廣,這也為我們收集足夠有代表性的人群樣本、建設标準化和高品質的生物樣本庫提出了特殊的挑戰。

當然,我們也不乏一些具有代表性和國際影響力的隊列樣本庫前例,如中國慢性病前瞻性研究(China Kadoorie Biobank, CKB)、泰州人群健康跟蹤調查(Taizhou Longitudinal Study, TZL,泰州隊列)、江蘇出生隊列(Jiangsu Birth Cohort)等。一些高品質的科研成果正是基于這些隊列的研究而産出的,而這些隊列探索的經驗為其他隊列後續開展研究提供了借鑒,包括從人群招募、随訪,到标準化資料生産、成果轉化等方面。

進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?
進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?
進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?

此次論壇上,複旦大學泰州健康科學研究院執行院長陳興棟研究員詳細介紹了泰州隊列的建設經驗

泰州隊列的經驗提示,隊列研究一定是服務當地的健康管理需求的。當地政府的參與、組織及影響力可以在人群招募及随訪、醫療資訊的互聯互通及研究成果的傳回方面發揮積極的貢獻。這幾年南京江北新區聯合南京醫科大學積極推進的大規模人群隊列研究也展現了這樣高效的“政企研醫”互動模式。頂層機制設計和支援,自上而下的組織推動形式,多方共同參與持續建設,這樣成功驗證的中國建設優勢值得更多分享。

事實證明,通過生物樣本庫的隊列研究可以提供初級預防的證據,可以提供開發篩查及診斷工具的證據,提供醫療決策的證據,提供藥物開發的新靶點新思路。是以,在隊列研究的成果認定及轉化上,不應隻關注所發表的文章、專利或專項著作的數量和品質,同時也要關注新的認識對于疾病風險檢測與疾病預防的實踐和指導(如将研究發現的新的緻癌基因納入疾病篩查,或推廣應用成本效益更高的多基因風險評分檢測等),考慮更多引入相應的産業方,去思考可能的早篩早診工具(泰州隊列對基于液體活檢的惡性良性腫瘤早篩方法學建構提供了良好的土壤)及治療藥物的開發、健康管理工具建構。

大陸人口及患者資源都較為豐富,很多醫院和研究機構之前都已經積累了相應規模的專病或普病的生物樣本;随着國内測序成本的持續下降,隊列建設及大規模人群的基因組學研究似乎又迎來了新的機會。當然,充分利用生物樣本的方法不完全都是前瞻性從頭建構新隊列,也可以探索重新利用已有隊列樣本進行疊代的機制。在原有樣本的基礎上通過WGS去疊加基因組資訊,實作隊列參與者人人可及基因組測序,關聯并結合已經收集到的表型、臨床、病理資料,這樣既可以更高效地發揮投資的價值,又能降低從頭建設的成本。當然,使用已有的隊列研究基礎,也要考慮現有的樣本品質(是否可用夠用)、參與者池(還能不能随訪)、資料管理系統(是否可拓展可整合)和治理結構(如何推動新舊項目的過渡和持續挖掘)等多方面的挑戰。

盡管如此,很多研究人員也都提到了,我們仍需要拓寬可選的資助來源,引入其他也能從未來成果轉化中獲益的機構,如吸引國内創新藥企的資助和參與,才能確定生物樣本庫建設的可持續性。

在生物樣本背後的資料治理上,更需要考慮可持續、可及的模式。一方面,随着基因組和其他多元資料量爆炸性增長,我們也需要加強資料平台及計算、分析工具的開發和建設。“既要有礦山,又要有鎬鍬掘金,也要有高速軌道把礦運送出去”。另一方面,就像UKB提示的成功經驗一樣,如何開放生态、加強資料共享,同時更多地去與其他高品質隊列資料進行整合研究,吸引更多的機構外研究人員參與資料的分析和解讀,這從機制上及管理上都對隊列建設都提出了高要求。此外,過去這兩年,國家在大資料資源上加強了安全、隐私、監管等各方面的要求,這對于建設隊列/生物樣本庫來說,從布局設計、實施、建構、随訪、資料管理到使用申請、資料成果共享、管理的全流程都需要全盤考慮。這樣才能逐漸摸索出最适應中國特色的生物樣本庫發展模式。

大規律大規模研究助力我們了解健康和疾病,也一定離不開國内國外的合作。加強國際間的合作,可以更好地幫助從病因學、遺傳學到風險預測的研究。整合不同地區的華人隊列,比如新加坡的華人跟國内華南地區的人群很相似,在複雜的慢性病研究上,可以更好地去提示相似人群在不同氣候環境、不同生活方式下的差異性和多樣性。同樣,國外隊列研究成果向健康衛生管理的轉化實踐經驗也值得借鑒。英國、新加坡等在隊列研究的基礎上已經實作的轉化的成果和經驗,包括從治療到預防、從疾病管理到健康管理、從醫院到社群、醫生的持續教育和下一代醫師的教育訓練體系、衛生經濟學的分析等都為國内開展類似工作提供了可以合作、借鑒、探索的背景。過去很多年,隊列研究、相應的資料分析和成果轉化都是發生在西方人群中,通過合作,國内的隊列研究可以更快地去跟已有的成果做結合做比較,這樣才能最大化研究的價值,讓所參與的人群真正從這樣的研究中獲益。

五、未來展望

科學本質上是一項集智事業。生物樣本庫是吸引不同的科學群體共享和內建的良好媒介。同時,生物樣本庫也是社會直接參與研究的方式,每一份樣本背後都蘊藏着很大的希望,作為回報,研究人員都希望能從這些樣本的研究中獲得最多的見解和知識。

大規模的實體生物樣本庫是一項非常有價值的長期資産,因為在樣本采集階段所擷取的人類生物樣本是有限的。典型的生物樣本庫仍然是“一次性發生的”,從特定群體中采集完生物樣本後進行存儲。是以,每個有限樣本的可用資訊越多,對這個樣本庫及研究人員來說就越有價值。像UKB這些大的生物樣本庫在豐富每個樣本所連結的資料次元上所做的嘗試一樣,基因組學及多組學技術的發展也為新時代的生物樣本庫資料生産提供了可選的工具。

高品質、資料豐富的樣本庫對于未來的研究至關重要。這也使得相應隊列研究的合理設計、生物樣本的采集、規範化計劃性一緻性的高效資料生産,以及可擴充可及的資料管理都十分重要。

大規模隊列生物樣本庫的最終目的依然是服務于疾病的精準預防、診斷和治療。但這永遠不會是一蹴而就的過程,UKB在招募完成後随訪了15年,自項目建立後20年才逐漸迎來了科學成果的逐漸展露,這種影響力的擴大建立在持續投入、持續開發、持續“利用”的基礎上。對于中國的隊列研究來說,從科學研究走向百姓日常,也需要時間,但更需要“以終為始”的成果轉化理念,既能讓參與者受益,又要讓大衆可以參與、可以了解。

進入數百元基因組時代,中國人群隊列研究如何乘勢崛起?

英國劍橋大學Emanuele Di Angelantonio教授在論壇上提到:隊列研究就如同葡萄酒,越醇厚才越有香味。這個比喻對于隊列建設來說,恰如其分

中國的隊列建設需要具備國際視野。建構中國自己的有影響力的隊列是普遍心聲,這需要探索有效的中國模式,但同樣需要更多地展示中國隊列的特色,跟國外其他隊列研究的結果進行彙總對比分析,需要更多的國内國際不同學科、不同領域的合作、協同和交叉。隻有将中國人群隊列的基礎研究結果讓更多的國際研究人員看到、索引并探索分析,中國人群才能不斷從整個科學界推進疊代的研究發現中最多獲益。

随着國内測序成本的持續下降,國内的隊列研究也将直接受益于基因組資訊的可及性提升,預期将有更多的中國人群研究被國際科學界所看到,我們也期待這些WGS加持的高品質中國隊列研究能進一步推動實作真正的個體化醫療防護。

繼續閱讀