Nature--迁移学习使得基因互作网络预测成为可能

绘制驱动疾病进展的基因调控网络，可以筛选出针对疾病的核心调控基因，从而为疾病治疗提供更有效的方法。

2023年5月31日，题为Transfer learning enables predictions in network biology的文章发表于《Nature》。

摘要

构建基因网络需要利用大量的转录组数据来学习基因之间的相互关系,这限制了基因网络在数据有限的情形下的应用,包括罕见病和难以获取的组织的疾病等。近来,迁移学习（transfer learning）为自然语言理解、计算机视觉等领域带来了彻底的变革。迁移学习通过有限的任务特异性数据对已在大规模常规数据集上预训练的深度学习模型进行微调,从而使其能够应用于大量的下游任务。在此,我们开发了一个基于注意力机制的上下文感知的深度学习模型Geneformer。Geneformer利用大约3000万个单个细胞转录组构成的大规模语料库进行了预训练,以在有限数据情形下实现下游网络生物学任务的预测。在预训练过程中,Geneformer 对网络动态学获得了基本的理解,可通过完全自监督的方式在模型的注意力权重中编码网络层次结构。在向一个涉及染色质和网络动态的多样的下游任务进行微调时,在有限的任务特异性数据下证明 Geneformer持续提高了预测准确度。在有限患者数据的疾病建模的应用中,Geneformer鉴定了心肌病的候选治疗靶点。总体而言,Geneformer代表了一个预训练的深度学习模型,可通过微调适应广泛的下游应用，进一步促进对关键网络调节因子和候选治疗靶点的发现。

图1 Geneformer架构与迁移学习策略 a 描述了迁移学习的流程图；b展示了3000万转录组数据的组织分布；c展示了预训练的Geneformer架构。

讨论

研究人员开发了一种基于深度学习的、对上下文敏感的模型—Geneformer，该模型通过大规模转录组数据的预训练，可以在数据有限的场景中进行预测。在预训练过程中通过观察大量的细胞状态，Geneformer对网络动力学有了基本的理解，并以完全自监督的方式在模型的注意力权重中编码网络层次结构。Geneformer通过对上下文敏感的计算模拟删除方法预测剂量敏感疾病基因的能力，为遗传变异的解释提供了宝贵的资产，包括对驱动复杂性状的GWAS靶点进行优先排序，并预测它们可能影响的特定组织。在胎儿心肌细胞中验证剂量敏感基因候选者TEAD4的实验结果支持了Geneformer在推动人类发育生物学深入研究方面具有重要的作用。

图2 使用有限的数据，Geneformer提高了基因剂量敏感性的预测能力。

在使用有限的患者样本进行心肌病疾病模型建模时，Geneformer预测了候选治疗靶点，并在iPSC疾病模型中进行实验性验证，结果发现CRISPR介导的iPSC衍生的心脏微组织中候选TEAD4的敲除导致其产生收缩应力（单位面积的力）的能力显著降低（如图2 e所示）。

因此，使用有限数据进行计算模拟治疗分析可能有助于发现以往受到数据限制而受阻的罕见疾病或影响临床难以获取组织的疾病的治疗方法。此外，我们发现，使用更大、更多样化的语料库进行预训练可以持续提高Geneformer的预测能力。此外，在预训练过程中接触数百个实验数据集似乎也有助于提高易受批次效应和个体差异影响的单细胞分析的稳定性。这些发现表明，随着公开可用的转录组数据量不断扩大，未来基于更大规模语料库的预训练模型可能会为实现更多难以探索的研究提供有意义的预测。

阅读原文内容：

https://www.nature.com/articles/s41586-023-06139-9

Nature--迁移学习使得基因互作网络预测成为可能

继续阅读

好好学习 | 建设中华民族现代文明，深刻领悟这三大要点→

#祝愿所有考生金榜题名#高考加油#知识改变命运#以梦为马不负韶华#好好学习天天向上

#祝愿所有考生金榜题名#以梦为马不负韶华#知识改变命运#好好学习天天向上#高考加油

#祝愿所有考生金榜题名#高考加油#以梦为马不负韶华#知识改变命运#好好学习天天向上

#为了买房,做一辈子的房奴值得吗?#人活在这个世界上，是来享受过程的，不是为了某种追求，而把自己搞得狼狈不堪，苦不堪言。

明朝万达2024年网络安全月报（5月）

怎样让你的照片更有意境？这组作品值得学习！

党纪学习教育｜一图了解生活纪律“负面清单”

【党纪学习教育】违纪行为有关责任人员如何进行责任区分

三个小小人识字分级阅读，送给孩子的礼物不知不觉，孩子到了幼小衔接的阶段。现在的孩子学习压力非常大，小小年纪就必须要掌握很

党纪学习教育丨哪些情形应当从重或者加重处分？

#给高考生的寄语#上联：龙年奋发笔生花，金榜题名显才华下联：学子勤勉心无悔，青春逐梦绽芳华横批：前程似锦解释：这首对联专

三元里村禁电鸡后真的像网络上说那么萧条吗？

这一网络微短剧，全网下线！

618大促精选：华为MatePad系列，满足你学习生活的全方位需求

多种形式学习国家通用语言文字持续为居民“充电”