空间转录组技术生成具有空间背景的基因表达谱,需要空间信息分析工具来完成三个关键任务:空间聚类、多样本整合和细胞类型去卷积。近日,《Nature Communications》发表了一种图自我监督的对比学习方法:GraphST,其充分利用空间转录组学数据,以优于现有方法。
GraphST是什么?
GraphST是一种图自我监督对比学习方法,它充分利用空间信息和基因表达谱进行空间信息聚类、整合和细胞类型去卷积。通过在GraphST中使用自我监督对比学习,发现它提高了学习下游分析的相关潜在特征的性能。
GraphST包括三个模块,每个模块都具有分别针对三个任务定制的图形自我监督对比学习架构:空间信息聚类(上图A)、多个组织切片的垂直和水平批量集成(上图 B),以及通过向ST投影scRNA-seq来进行空间细胞类型去卷积(上图C)。在所有三个模块中,利用空间转录组学数据集的空间信息来构建邻域图,其中空间上彼此接近的点被连接起来。接下来,构建图卷积网络作为编码器,通过迭代聚集来自相邻点的基因表达,将基因表达谱和空间相似性嵌入潜在表示空间中。
GraphST的性能测试
开发团队利用GraphST在人类和小鼠组织的不同10x Visium、Stereo-seq和Slide-seqV2数据集上的三个分析任务进行了广泛测试,这些组织包括人脑、人类乳腺癌症组织、人类淋巴结、小鼠乳腺癌症、小鼠嗅球、小鼠大脑和小鼠胚胎。
聚类测试表明GraphST在识别空间域方面优于七种现有方法。
GraphST聚类改善了人类背外侧前额叶皮层(DLPFC)、小鼠嗅球和小鼠海马组织中组织结构的识别。
GraphST能够准确识别Stereo-seq小鼠胚胎中的不同器官。
对小鼠乳腺癌和小鼠脑数据集的联合分析表明:GraphST能够从多个组织切片中准确识别空间域,同时有效地消除批量效应,而无需明确检测批量因素。
GraphST 能够分别对小鼠乳腺癌的 ST 数据和小鼠大脑前部和后部数据进行准确的垂直和水平整合。
开发团队还测试了 GraphST 将 scRNA-seq 数据投影到 ST 上以预测空间点中的细胞状态(细胞类型和样本类型)。计算出的细胞点映射矩阵比 cell2location(性能最好的去卷积方法)更准确地估计细胞类型组成。
比较 GraphST 与TOP去卷积方法 cell2location 在预测 scRNA-seq 数据与模拟数据、人类淋巴结和 DLPFC 切片 151673 的空间分布方面的准确性。
GraphST可以将scRNA-seq中提取的样本表型转移到ST上。开发团队通过描绘肿瘤衍生组织切片中的肿瘤和正常相邻区域来证明了这一能力。
GraphST 能够对人类乳腺癌数据中的 scRNA-seq 数据进行全面准确的空间映射。
GraphST工具包的开源Python实现可从如下链接获取:
https://github.com/JinmiaoChenLab/GraphST.
首发公号国家基因库大数据平台
参考文献
Long, Y., Ang, K.S., Li, M. et al. Spatially informed clustering, integration, and deconvolution of spatial transcriptomics with GraphST. Nat Commun 14, 1155 (2023).