天天看点

从Bulk转录组中分析单细胞空间异质性

作者:BioArtMED

近年来,单细胞测序(scRNA-seq)的兴起引领生命科学研究进入单细胞时代,而空间转录组(Spatially resolved transcriptomics)技术在保留空间信息的同时也彻底变革了人们理解复杂组织的方式。因此,空间转录组技术也被Nature Methods和Nature杂志分别评为2020年度技术以及2022年最值得关注的七大技术。然而,目前的单细胞测序和空间转录组技术并没有实现完美的融合。一方面,单细胞测序需要在细胞混悬液的基础上进行单细胞标记,这会导致细胞空间信息的丢失。另一方面,目前两种主流的空间转录组技术,1)基于空间条形码标记(Spatial barcoding-based)的测序技术,如Slide-seq, DBiT-seq, ST, HDST, 10X Visium等,往往以微米级的规则Spot为单位进行测序,尚无法实现单细胞分辨率;2)基于成像技术(Imaging-based)的原位杂交或测序方法,如MERFISH, SeqFISH, STARmap等,能够在组织中识别出细胞轮廓,进而将亚细胞分辨率的mRNA探针信号聚合成单细胞表达谱,然而,这些靶向方法(Targeted methods)都依赖于探针与靶标RNA的互补配对,因此,无法实现全转录组的覆盖以及变异序列的检测【1】(图1)。不仅如此,目前的空间转录组测序成本昂贵,组织覆盖范围有限,样本通量较低,严重制约了其推广与应用。与此同时,传统的混样(Bulk)测序一直是生物医药研究的主流工具,许多大型Bulk RNA-seq项目如TCGA、ENCODE、ICGC等的相继开展为生命科学和医药学研究累积了海量数据资源。因此,如何充分利用这些遗留资源,从Bulk数据中分析得到单细胞分辨的空间异质性,是该领域所面临的重大科学问题和技术挑战。

从Bulk转录组中分析单细胞空间异质性

图1 不同空间转录组测序技术之间的比较(基因检测数量/细胞或Spot检测通量)

近日,浙江大学科研团队在Nature Communications上发表了题为De novo analysis of bulk RNA-seq data at spatially resolved single-cell resolution的研究论文。该研究创新提出了一种空间解卷积算法——Bulk2Space,利用β-VAE等深度学习框架,首次实现将Bulk转录组重构至单细胞空间分辨率。

从Bulk转录组中分析单细胞空间异质性

该研究通过引入变分自编码器(β-VAE)、深度森林(deep forest)等算法,首先对Bulk转录组进行解卷积,将其转化为单细胞转录组图谱,进而将生成的单细胞映射至组织空间中(图2)。针对目前主流的两种空间参考图谱:(1)基于Spatial barcoding的测序方法,如Slide-seq、10X Visium、ST等:Bulk2Space可对每个spot进行解卷积,使其达到单细胞的空间分辨率;(2)基于分子成像的靶向技术,如MERFISH、SeqFISH、STARmap等:Bulk2Space通过空间寻优策略,将细胞映射至最佳的空间位点,使其达到无偏的全转录组覆盖度。Bulk2Space也是首个能够将传统Bulk转录组数据重构至单细胞空间分辨率的算法。

从Bulk转录组中分析单细胞空间异质性

图2 Bulk2Space算法原理示意图

研究团队首先在模拟和真实数据集中对Bulk2Space以及其它算法(RCTD,SpatialDWLS,Stereoscope,SPOTlight等)进行了性能评测,Bulk2Space在两种情景中都展现出了优异的性能,且成功应用于多种生物学和疾病场景,具有广泛的应用前景。例如,将Bulk2Space应用于在胰腺导管癌(PDAC)的bulk转录组数据的空间解卷积中,研究结果表明,肿瘤注释区域与两种肿瘤克隆细胞的空间分布基本一致,导管细胞和腺泡细胞的空间分布也与导管上皮和基质注释区域相吻合(图3)。同样地,将Bulk2Space应用于黑色素瘤bulk转录组的空间分析中,发现了不同肿瘤区域中B淋巴细胞存在很强的空间异质性,表现在基因表达上的巨大差异,对应的生物学通路也完全不同。而这个结果在其它空间解卷积方法中无法实现,正因为Bulk2Space可以将bulk数据重构至单细胞分辨率,才使得细胞异质性和空间差异得以同时解析。随后,利用Bulk2Space分析不同阶段前列腺癌bulk转录组的单细胞组成和空间分布,发现在前列腺癌由炎症向癌症转化的过程中(炎癌转化),细胞种类和基因表达存在着明显的空间差异。在炎癌转化过程中,肿瘤相关成纤维细胞(Cancer associated fibroblasts, CAFs)在早期的正常腺体中积累,导致炎症因子高表达,促进局部炎症的发生,进而导致组织癌变。Bulk2Space的预测结果与这一现象一致。

从Bulk转录组中分析单细胞空间异质性

图3 利用Bulk2Space对PDAC的bulk转录组数据进行单细胞空间重构分析。(a)单细胞重构结果(b)Bulk2Space预测结果与PDAC病理注释之间的比较(c)Bulk2Space对腺泡细胞、肿瘤克隆A细胞、肿瘤克隆B细胞以及导管细胞空间占比分布的预测结果。

论文中,团队还将Bulk2Space应用于小鼠脑组织不同脑区Bulk数据的空间解卷积分析。相关数据均采自范骁辉教授团队自主研发的基于激光捕获显微切割技术(LCM)的高通量多样本空间测序技术——Spatial-seq。如图4所示,利用Bulk2Space对小鼠皮层bulk转录组进行单细胞分辨的空间解卷积,预测结果成功重塑了小鼠皮层的层级空间结构,不同层级中的细胞分布和基因表达均表现出高度的区域化特征(图4a-b)。同时,利用Bulk2Space对Spatial-seq采集的下丘脑bulk转录组数据进行了空间分析,选取MERFISH空间转录组数据作为空间参考图谱,Bulk2Space的预测结果与MERFISH高度吻合。不仅如此,由于MERFISH的靶基因数量(150种mRNA)有限,部分细胞类型难以确定,Bulk2Space成功预测了MERFISH未检测基因的空间表达分布,进而对这些难以确定身份的细胞进行了二次注释,弥补了靶向方法的不足(图4c-f)。

从Bulk转录组中分析单细胞空间异质性

图4 利用Bulk2Space算法和Spatial-seq技术对小鼠皮层和下丘脑的bulk转录组数据进行空间解卷积分析。(a)小鼠皮层单细胞重构结果(b)小鼠皮层各层级细胞类型占比分布规律(c)下丘脑空间重构结果(d)Bulk2Space预测的基因空间表达(e)Bulk2Space对下丘脑中MERFISH未识别细胞的二次注释(f)Bulk2Space对MERFISH未检测基因的空间表达预测

Bulk2Spac算法现已开源至GitHub平台(https://github.com/ZJUFanLab/bulk2space)。研究论文由浙江大学药学院、浙江大学计算机科学与技术学院和军事医学科学院放射与辐射医学研究所联合报道。

从Bulk转录组中分析单细胞空间异质性

原文链接:

https://www.nature.com/articles/s41467-022-34271-z

制版人:十一

参考文献

1. Liao J, Lu X, Shao X, Zhu L, Fan X. Uncovering an Organ's Molecular Architecture at Single-Cell Resolution by Spatially Resolved Transcriptomics. Trends Biotechnol. 2021;39(1):43-58. doi: 10.1016/j.tibtech.2020.05.006.

转载须知

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。

继续阅读