题目:Single-cell Transcriptomic Landscape of Human Blood Cells
期刊:National Science Review (IF:17.275)
发表年份:24 August 2020
摘要
背景:目前缺乏一个关于全血系统的单细胞层面转录组参考系。
方法:1.使用Single-Cell Tagged Reverse Transcription RNA Sequencing (STRT-seq) strategy,分析21个健康献血者的32种免疫细胞类型,得到了总共7551个人血细胞,发现蛋白质编码基因和lncRNAs 构建的人血单细胞转录图谱(atlas of blood cells ,ABC)具有高度一致性。
2.使用SCENIC构建了转录因子和靶基因的调节网络,发现中性粒细胞和单核细胞中共同的转录因子调控网络被激活。
3.分析每个特定细胞群(HSPCs、B细胞、NK细胞、T细胞、单核细胞、中性粒细胞和红细胞)的分化轨迹和特征,发现有核红细胞与免疫信号通路密切相关。
意义:提供了单细胞分辨率的人血细胞转录图谱,从而为探索生理和病理造血提供了全面的参考。
实验设计及质控
样本:21个健康成人的骨髓和外周血的单核细胞
细胞: 流式分选了32种血细胞,过滤后得到了7551个细胞进行下游分析。
细胞过滤标准: 1.保留至少有1000个蛋白质编码基因表达的细胞,总共有7551个细胞符合要求。2.保留至少有500个 lncRNA 表达的细胞,总共有7192个细胞符合要求。
大致的单细胞下游分析流程:SCTransform → IntegrateData→RunPCA→ FindCluster→ FindVariableFeatures→RunUMAP →FindNeighbors and FindClusters →SCENIC →HOMER → bedtools →Monocle3 →scran
结果
1.人类血液细胞转录组参考系
首先,整体而言,HSPC和单核细胞表达的基因数量最多,而NK细胞、T细胞和中性粒细胞的转录相对静止(图1B)。值得注意的是,与HCA数据库相比,他们的数据能够检测到更多的基因和转录因子用于深入分析(P<2.2e-16,图1C),并且在检测低丰度基因方面尤其具有优势。
他们接着整合了所有造血细胞的单细胞转录组图谱,然后通过UMAP进行降维和可视化。发现从HSPC开始,向淋巴细胞(B细胞、NK细胞和T细胞)、髓系细胞(单核细胞和中性粒细胞)和红细胞分支,揭示了造血分化的总体轨迹。与B细胞、单核细胞和红细胞相比,他们发现NK细胞、T细胞和中性粒细胞缺乏从祖细胞到分化细胞的连续转录转移,这表明这些细胞在成熟过程中可能获得基因表达的”戏剧性“变化,或者存在已知的表面标记没有捕捉到的过渡群体(图1D)。
最后,他们观察到AVP在HSCs和MPPs中特异表达。CD79B、GZMH和CCR7分别在B细胞、NK细胞和T细胞中高特异性和高表达,SPI1和GATA1分别在中性粒细胞/单核细胞和红细胞中高表达(图1E),验证了每种细胞中与造血相关的已知标记基因。通过对20多个健康献血者的多个典型造血群体的深度测序,他们的人类血细胞单细胞转录图谱为人类生理性和病理性造血研究提供了有价值的转录组参考。
2.造血分化的转录因子调控网络
为了解析造血分化相关转录因子调控网络(调节子),使用SIENIC计算了所有转录因子的调控活性分数(RAS),然后构建了人类血细胞的调控图谱。结果显示,由调节子揭示的造血分化轨迹与单细胞转录组的数据结果总体一致(图2A)。
接着,通过无监督的聚类将造血细胞分成20个调控簇,称为C1到C20,每个调控簇都显示出高度特异的调节子集基因的激活(图2B)。在主要由HSPC细胞组成的C1/C2簇细胞中,HOX基因被激活。TCF4、EBF1和LEF1在代表B细胞的C3~C7簇中活性较高,浆细胞中PRDM1和XBP1活性较高,而NK/T细胞中GATA3和Tbx21活性较高。CEBP和SPI1在中性粒细胞/单核细胞系中显示出高活性,而GATA1和KLF1在红系中被激活(图2C)。值得注意的是,单核细胞和中性粒细胞共享大多数髓系特有的调节子基因,而淋巴细胞调节子则有着明显的细胞类型特异性,在B淋巴细胞成熟过程中调节子的变化证明了这一特点(图2C)。
3.单细胞转录组的非编码RNA图谱
LncRNAs在造血细胞的分化和发育过程中起着至关重要的作用。然而,在单细胞水平下lncRNAs在造血细胞中的表达谱尚未见报道。因此,他们基于lncRNA表达水平,构建一个包含7192个血细胞的转录图谱。根据NONCODE数据库的基因组注释,32种免疫表型细胞平均可以检测到1700多个LncRNAs。与蛋白质编码基因一致,HSPC和单核细胞表达的lncRNAs数量最多,而NK细胞、T细胞和中性粒细胞表达的lncRNAs数量最低(图3A)。而且仅用lncRNAs构建的造血分化轨迹与蛋白质编码基因构建的分化轨迹高度一致(图3B)。
为了进一步剖析转录异质性,他们计算了蛋白编码基因和lncRNA在任何两种免疫表型细胞类型之间差异表达的基因(DEG)。DEG数量表明lncRNAs和蛋白质编码基因之间有很高的一致性(图3C)。这些结果表明,lncRNAs的动态变化能够描述整个造血系统的层次结构。
接下来,他们确定了每种免疫表型细胞类型的标志性蛋白编码基因和lncRNAs,发现lncRNA signature 倾向于与其相邻的蛋白编码基因相关联,以获得更多分化的细胞类型,而不是祖细胞(图3D)。此外,lncRNA signatures显示出更高的PhastCons保守分数和更高的细胞特异性(图3E-F)。特别是,与造血特征的基因(AVP、CD79B、GZMH、CCR7、SPI1和GATA1)相邻的lncRNA(NONHSAG031143.2、NONHSAG073805.1、NONHSAG069091.1、NONHSAG108638.1、NONHSAG008235.2和NONHSAG103763.2)分别在HSPC、B细胞、NK细胞、T细胞、中性粒细胞/单核细胞和红细胞中高表达(图3G)。这些发现在单细胞水平上鉴定出了造血细胞中特异表达的lncRNAs,它们倾向于与其相邻的蛋白编码基因共表达,以获得更多的细胞分化类型。
3. 造血细胞亚群的精细图谱
接下来精确剖析了每个特定细胞亚群(HSPC、B细胞、NK细胞、T细胞、单核细胞、中性粒细胞和红细胞)的分化轨迹和特征。考虑到CD71+红细胞的免疫作用在以往的研究中已有报道,因此作者们首先关注了红系细胞群。首先将来自不同捐赠者的细胞整合在一起,然后用UMAP降维和可视化。他们发现,在红系谱系中,Ery/Gra1和Ery/Gra2显示了与中性粒细胞和单核细胞/树突状细胞(MD)特征相关的高表达基因(图4A)。
Ery/Gra1和Ery/Gra2中特异表达基因的GO富集分析主要富集在中性粒细胞相关、吞噬和炎症反应以及抗原处理和提呈通路,这暗示了这两个红细胞亚群可能有先天性和获得性免疫功能(图4B)。伪时间分析表明,Ery/Gra2簇有着独特的免疫相关基因表达,例如VCAN和S100A9基因(图4C-D)。此外,他们发现CD74+有核红细胞主要表达在Ery/Gra1和Ery/Gra2簇(图4D)。随后,他们还描述了HSPC、B细胞、NK细胞、T细胞、单核细胞和中性粒细胞的分化轨迹和功能多样性。正如预想的一样,HSPC的分化轨迹包含了淋巴系、髓系和红系/巨核系在内的祖细胞的分支(图4e)。伪时间分析反映了B和NK细胞群体的分化轨迹(图4F-G)。对于T细胞群,CD4T和CD8T细胞可各分为三类,分别包括初始T细胞、记忆T细胞和效应性T细胞。CD4初始T细胞和记忆T细胞紧密相靠,但CD8记忆T细胞和却与效应T细胞紧密相连(图4H-I),接着是单核细胞和中性粒细胞亚群的分化轨迹(图4J-K)。最后,他们发现细胞周期相关基因在HSPC分化过程中被激活,而在血细胞成熟过程中则失活(图4L)。综上所述,他们详述了每个细胞压群的分化轨迹图谱,并观察了有核红细胞的免疫激活情况。
综上所述,他们详述了每个细胞群体的分化图谱,并观察了有核红细胞的免疫激活现象。
最后,作者建立了一个在线数据库(http://scrna.sklehabc.com/)来可视化数据,并且可预测用户自己数据的单细胞转录组细胞类型。
总结
1.该研究借助单细胞转录组深度测序技术,覆盖了从造血干细胞到祖细胞再到各谱系成熟血细胞在内的32种类型的血细胞,绘制了人全血细胞的精细分子图谱。
2.揭示了全新的与造血分化相关的lncRNAs和转录因子,并对主要血细胞群体进行精细分群和定义,首次提出CD74阳性的有核红细胞可能具有免疫调节功能。
3.在线数据库有助于我们在单细胞水平上找到某特定基因在32种血细胞的表达水平变化,以及可以利用自己的数据绘制发育分化轨迹图谱。
总的来说,该研究图谱全面地整合了血细胞的转录组信息和免疫表型信息,为后续血液生理学和病理学研究提供了重要的血细胞注释依据和参考价值。