天天看点

Nature Genetics | 肝硬化遗传机制的新突破:跨群体遗传分析揭示关键风险位点

作者:生物探索
Nature Genetics | 肝硬化遗传机制的新突破:跨群体遗传分析揭示关键风险位点

引言

肝硬化是一种慢性肝病,表现为肝细胞的广泛坏死和纤维化,导致肝脏结构和功能的严重破坏。近年来,随着遗传学和基因组学的发展,人们对肝硬化的遗传基础有了更深的了解。肝硬化的发病机制复杂,涉及多个基因和环境因素的相互作用。全基因组关联研究(Genome-Wide Association Studies, GWAS)是研究遗传变异与疾病相关性的一种有效方法,它通过分析大量个体的基因组数据,寻找与特定疾病相关的遗传标记。4月17日发表于Nature Genetics上的研究“Integrative common and rare variant analyses provide insights into the genetic architecture of liver cirrhosis”,通过整合常见和罕见变异分析,探索了肝硬化的遗传架构,旨在揭示影响肝硬化发生的主要遗传因素。研究首先在欧洲人群中进行了一阶段的GWAS meta分析,涉及9个研究,包括15,225例肝硬化病例和1,564,786名对照个体。此Meta分析显示出遗传多样性的影响,其中12个基因组显著变异(genome-wide significant variants)被识别,5个是首次在肝硬化GWAS中报道。该研究还探讨了这些变异在不同种族中的效应,发现部分变异在欧洲人群和东亚人群中存在异质性效应。研究的第二阶段是跨种族GWAS meta分析,旨在探讨不同人种之间的遗传差异。此外,研究还估计了肝硬化的遗传力(heritability),即疾病变异中由遗传因素所解释的比例。遗传力的估计有助于理解遗传因素在疾病发展中的重要性。研究发现,尽管统计能力有限,但欧洲人和东亚人的单核苷酸多态性(Single Nucleotide Polymorphisms, SNPs)基于遗传力估计是一致的。此外,研究还创建了基于特定SNP的多基因风险评分(Polygenic Risk Scores, PRS),并比较了这些评分在预测肝硬化风险方面的有效性。通过这些复杂的分析,该研究不仅增进了我们对肝硬化遗传学的理解,而且提供了潜在的遗传标记,这些标记未来可能用于预测疾病风险和发展个性化的治疗策略。

Nature Genetics | 肝硬化遗传机制的新突破:跨群体遗传分析揭示关键风险位点

Highlights

大规模多族群基因组关联研究:研究涵盖了18,265例肝硬化病例和1,782,047个对照个体,这是一个跨种族的大规模样本研究,包括欧洲人、东亚人、非洲裔美国人和西班牙裔美国人,这有助于更广泛地识别与肝硬化相关的遗传因素。新风险位点的发现:研究发现了14个与肝硬化风险相关的新遗传位点,这些位点中的许多位于与肝脏脂质代谢(hepatic lipid metabolism)有关的基因附近。多表型信息增强(endophenotype-driven)的基因组发现:通过使用与肝酶水平相关的基因组关联研究结果作为先验信息,研究增强了对肝硬化遗传风险因素的识别能力。聚焦罕见编码变异:在普通变异分析中优先考虑的基因中,罕见编码变异在GPAM基因中发现,与较低的丙氨酸氨基转移酶(alanine aminotransferase, ALT)水平相关,支持GPAM作为潜在的治疗靶点。多因素风险评分(polygenic risk score, PRS):开发了一种多因素遗传风险评分,该评分与从肝硬化进展到肝细胞癌(hepatocellular carcinoma, HCC)的风险相关联。

Nature Genetics | 肝硬化遗传机制的新突破:跨群体遗传分析揭示关键风险位点

研究的整体设计及主要结果a. 整个研究设计,第一阶段为针对欧洲群体的基因组宽泛关联研究(GWAS) meta分析,第二阶段则为跨族群的GWAS meta分析。这一设计能够揭示不同族群之间遗传差异对肝硬化风险的影响。b. 肝硬化GWAS的迈阿密图(Miami plot)。横轴显示了单核苷酸多态性(SNPs)的染色体位置,纵轴显示了关联强度(以-log10(P)表示)。(Credit: Nature Genetics)

Strategies

该研究采用了整合多组学数据的方法,通过多祖源基因组关联研究(genome-wide association study, GWAS)对肝硬化及其相关的内表型(endophenotypes)如丙氨酸氨基转移酶(alanine aminotransferase, ALT)和γ-谷氨酰转移酶(γ-glutamyl transferase, GGT)进行了研究。研究包括来自12个队列的18,265个肝硬化病例和1,782,047个对照,通过对这些数据进行meta分析,旨在发现与肝硬化相关的新风险位点。首先,研究人员进行了欧洲人群的GWAS meta分析,分析了15,225个肝硬化病例和1,564,786个对照的数据。使用的分析工具包括genomic inflation factor (λGC)和连锁不平衡得分回归(linkage disequilibrium score regression, LDSC)来评估遗传异质性和多基因性。在这一阶段,研究人员识别出12个全基因组显著性变异位点。在第二阶段,研究人员进行了跨祖源的固定效应meta分析(cross-ancestry fixed-effects meta-analysis),包括了来自不同祖源的18,265个病例和1,782,047个对照。在这一阶段,他们识别了15个变异位点,其中8个是之前未报道过的。此外,通过将肝酶GWAS关联作为先验信息,研究人员增强了基因组发现的能力,分析了多达100万欧洲血统个体的数据,识别出与ALT和GGT有关的独立基因组信号。最后,该研究还利用了多变量Mendelian随机化(multivariable Mendelian randomization, MVMR)技术,评估了非酒精性脂肪肝病(non-alcoholic fatty liver disease, NAFLD)在肥胖和酒精摄入量与肝硬化风险关系中的潜在中介作用。

Behind the Scenes

肝硬化肝硬化(cirrhosis)是一种慢性肝脏疾病,其主要特征是肝脏结构的永久性改变,包括正常肝组织的广泛纤维化(fibrosis)和异常结节(nodules)的形成。这些改变导致肝脏功能丧失,进而影响整个身体的健康状态。根据全球疾病负担研究(Global Burden of Disease Study),肝硬化是全球死亡率高的主要原因之一。2019年数据显示,肝硬化及其并发症每年导致全球约120万人死亡。肝硬化的发病率和死亡率在全球各地区均有所不同,尤其在发展中国家较高。

病理生理学基础肝硬化的发展通常分为几个阶段,从肝细胞(hepatocytes)的轻微损伤到完全的组织结构重塑。以下是肝硬化形成的几个关键步骤:肝细胞损伤与炎症反应:长期的肝脏损伤,如长期饮酒(alcohol consumption)、非酒精性脂肪肝病(NAFLD)或病毒性肝炎(viral hepatitis),会导致肝细胞死亡。死亡的肝细胞引发炎症反应,吸引免疫细胞到损伤部位,促进炎症细胞因子(inflammatory cytokines)的释放。纤维化形成:慢性炎症促使肝星状细胞(hepatic stellate cells)活化,这些细胞转化为纤维化细胞(myofibroblasts),产生大量胶原蛋白(collagen)和其他细胞外基质蛋白(extracellular matrix proteins),导致肝组织硬化并形成纤维带(fibrous bands)。血流动力学改变:随着肝组织结构的改变,肝脏的血管也会受到影响。肝内血管阻力增加导致门静脉高压症(portal hypertension),这是肝硬化最严重的并发症之一。门静脉高压可以导致脾肿大(splenomegaly)、腹水(ascites)和食管静脉曲张(esophageal varices)等严重问题。肝功能衰竭:随着肝硬化的进展,肝脏的解毒、代谢和合成功能逐渐减退。这可能导致多种代谢异常,包括蛋白质合成下降、凝血功能障碍(coagulopathy)和胆汁代谢异常(bilirubin metabolism)。肝癌的风险增加:慢性肝炎和持续的肝细胞再生过程增加了肝细胞癌(hepatocellular carcinoma, HCC)的风险。这种癌症通常发生在已经有肝硬化基础的患者身上。

遗传易感性与肝硬化研究发现,在欧洲人群中,SNP(单核苷酸多态性)基础的遗传度估计显示,遗传变异解释了肝硬化表型变异的5.1%(置信区间:3.5%-6.8%)。在东亚人群中,这一数字为2.7%(置信区间:-2.7%-8.1%)。这表明遗传因素在不同种族间对肝硬化的影响存在一定差异。

主要遗传变异与肝酶水平特定的遗传变异如PNPLA3 rs738409 和TM6SF2 rs58542926,与肝酶水平高(Alanine aminotransferase, ALT)和肝硬化风险显著相关。例如,TM6SF2 rs58542926变异每增加一个等位基因,ALT水平上升0.10标准差(置信区间:0.07–0.13),同时与肝硬化风险显著相关(风险比:1.09,置信区间:1.06–1.12)。

遗传风险评分(Polygenic Risk Scores, PRS)与肝病结果通过构建多个遗传风险评分(PRS),该研究评估了这些PRS与肝癌(Hepatocellular carcinoma, HCC)和肝硬化等肝病结果的关联。PRS15-SNP显著提高了HCC的风险预测能力。在英国生物银行(UK Biobank, UKB)中,拥有高PRS15-SNP得分(PRS分布的顶部20%)的肝硬化患者,其10年HCC风险为15.0%(置信区间:9.7%–22.0%),显著高于PRS分布底部80%的患者(5.8%,置信区间:4.3%–7.6%)。

肝病机制与遗传变异通过PheWAS分析,该研究进一步探索了特定遗传变异如PNPLA3 p.Ile148Met(rs738409)的表型广泛影响。该变异与肝硬化、非酒精性脂肪肝病(Non-alcoholic fatty liver disease, NAFLD)和酒精性肝病(Alcoholic liver disease, ALD)之间显示出比例效应。此外,该变异与高酒精摄入、肥胖(Body Mass Index, BMI > 30 kg/m^2)和2型糖尿病(Type 2 diabetes, T2D)等环境因素的交互作用显著,增加了肝细胞癌和所有原因肝病的风险。

稀有编码变异对肝硬化的影响稀有编码变异(Rare coding variants)通常指的是那些在人群中出现频率较低的遗传变异,这些变异通常涉及基因编码区域的突变,可能导致蛋白质结构或功能的改变。

稀有变异的疾病关联性分析在分析肝硬化的遗传基础时,研究团队特别关注那些可能通过改变肝脏代谢或免疫反应等关键生理过程来增加肝硬化风险的稀有变异。例如,PNPLA3基因中的p.Ile148Met(rs738409)变异就是一种已知的与肝脂肪沉积和肝脏疾病进展密切相关的稀有编码变异。此外,研究还发现TM6SF2基因中的稀有变异与肝酶水平升高(ALT)和肝硬化风险增加相关(OR: 1.09,95% CI: 1.06–1.12)。

功能性和表型宽度的探讨通过定位影响基因表达的分子定量性状位点(molecular QTLs),如表达量定位(eQTL)和蛋白水平定位(pQTL),研究人员进一步探究了稀有变异与疾病特征之间的联系。例如,通过比较表达量QTL分析与肝硬化的关联数据,研究人员可以推断出哪些基因在肝硬化的发展中可能起到关键作用。此外,利用共定位分析,研究人员能够评估肝硬化风险位点和特定基因表达之间的因果关联。

潜在的局限性样本分布不均衡(Imbalanced Sample Distribution) 研究中,欧洲后裔的样本占比最高,而非洲裔美国人和西班牙裔美国人的样本相对较少,导致无法有效估计这些群体的遗传易感性。样本分布的不均衡可能会影响研究结果的推广性,限制了发现与其他种族特有的遗传变异的可能性。

遗传异质性(Genetic Heterogeneity) 研究发现某些遗传变异在不同种族中的表现形式不同,如ALDH2和SERPINA1基因的变异在东亚人群中较为常见,而在其他种族中则较罕见。这种遗传异质性可能导致跨种族研究的复杂性增加,使得针对特定遗传变异的疾病风险预测和治疗策略的制定变得更加困难。

研究设计与执行限制(Study Design and Execution Limitations) 尽管采用了多个队列和大规模的样本来提高研究的统计力,但该研究仍面临一些设计和执行上的限制。例如,部分数据集中遗传变异的信息不全(如ALDH2 rs671变异在非东亚人群中缺失),影响了对这些变异与肝硬化风险关系的全面评估。

统计能力限制(Statistical Power Limitations) 非欧洲后裔的样本量较小,可能限制了在这些群体中进行的遗传易感性研究的统计力,导致无法准确估计遗传变异对肝硬化风险的影响。此外,多元修正(Multivariable Mendelian Randomization)分析的结果可能由于样本量不足而受到影响,不能完全排除遗传变异通过非直接途径影响肝硬化风险的可能性。

结果的可重复性与可验证性(Reproducibility and Verifiability) 虽然研究中的某些遗传变异与肝硬化的关联在复制队列中得到了验证,但仍有一部分变异的效应未在复制分析中达到统计显著性。这可能表明部分发现具有偶然性,需要在更大、更多样化的群体中进行进一步验证。

表型定义的复杂性(Complexity of Phenotypic Definitions) 肝硬化作为一种复杂疾病,其发病机制涉及多种因素。该研究虽然尝试通过PheWAS探索遗传变异与其他健康状况的关联,但表型的定义和测量可能存在差异,影响了对遗传变异作用机制的全面理解。

潜在的研究方向基因和环境因素的交互作用分析(Analysis of Gene-Environment Interactions)随着遗传风险因子与环境因素如酒精摄入、肥胖和2型糖尿病之间的交互作用对肝硬化风险的影响日益明显,未来的研究可更深入探讨这些交互作用。通过更广泛的人群和更详细的环境数据,研究可以更准确地揭示这些因素如何共同作用于肝硬化的发生与发展。

多组学和表型关联研究(Multi-Omics and Phenome-Wide Association Studies)多组学(multi-omics)数据的整合和表型关联研究(phenome-wide association study, PheWAS)可以为肝硬化的遗传研究提供新的视角。通过结合基因组、蛋白质组和代谢组数据,研究者能够更全面地理解肝硬化的生物机制,并可能发现新的生物标记物和治疗靶点。

再验证与治疗靶点的发现(Replication and Discovery of Therapeutic Targets)虽然已识别出多个与肝硬化相关的遗传变异,但是这些发现需要在更大的、多样化的样本中进行验证。此外,基于这些关联的遗传变异,未来的研究应着重于开发新的治疗方法,尤其是那些可以在早期阶段阻断疾病进程的靶向药物。

基因型与环境因素的综合预测模型(Integrated Predictive Models of Genotype and Environmental Factors)构建包含遗传和环境因素的综合预测模型,可以更准确地预测个体发展肝硬化的风险。这种模型将有助于实现个体化的预防策略和早期干预,特别是在高风险人群中。

遗传多样性的广泛研究(Extensive Research on Genetic Diversity)目前的研究主要集中在欧洲后裔上,需要扩展到其他种族和地理区域的人群,以确保研究结果的普遍适用性和有效性。探索不同人群的遗传差异将有助于全面理解肝硬化的遗传结构,并可能揭示特定人群中的独特风险因素。

原文链接

Ghouse J, Sveinbjörnsson G, Vujkovic M, Seidelin AS, Gellert-Kristensen H, Ahlberg G, Tragante V, Rand SA, Brancale J, Vilarinho S, Lundegaard PR, Sørensen E, Erikstrup C, Bruun MT, Jensen BA, Brunak S, Banasik K, Ullum H; DBDS Genomic Consortium; Verweij N, Lotta L, Baras A; Regeneron Genetics Center; Mirshahi T, Carey DJ; Geisinger-Regeneron DiscovEHR Collaboration; VA Million Veteran Program; Kaplan DE, Lynch J, Morgan T, Schwantes-An TH, Dochtermann DR, Pyarajan S, Tsao PS; Estonian Biobank Research Team; Laisk T, Mägi R, Kozlitina J, Tybjærg-Hansen A, Jones D, Knowlton KU, Nadauld L, Ferkingstad E, Björnsson ES, Ulfarsson MO, Sturluson Á, Sulem P, Pedersen OB, Ostrowski SR, Gudbjartsson DF, Stefansson K, Olesen MS, Chang KM, Holm H, Bundgaard H, Stender S. Integrative common and rare variant analyses provide insights into the genetic architecture of liver cirrhosis. Nat Genet. 2024 Apr 17. doi: 10.1038/s41588-024-01720-y. Epub ahead of print. PMID: 38632349.

https://www.nature.com/articles/s41588-024-01720-y

责编|探索君

排版|探索君

转载请注明来源于【生物探索】

End