使用单细胞转录组学的时间模型
Temporal modelling using single-cell transcriptomics | Nature Reviews Genetics
在单细胞水平上分析基因的方法已经彻底改变了我们研究多种生物过程和系统的能力,包括发育、分化、应答程序和疾病进展。在许多这些研究中,细胞随着时间的推移被分析,以推断细胞状态和类型的动态变化,表达的基因组,活性途径和关键调节因子。然而,时间序列单细胞 RNA 测序(scRNA-seq)也提出了一些新的分析和建模问题。这些问题包括确定何时以及如何深入剖析细胞,在时间点内和之间连接细胞,学习连续轨迹,以及整合大量和单细胞数据以重建动态网络模型。在这篇综述中,我们讨论了几种分析和建模时间序列 scRNA-seq 的方法,强调了它们的步骤,关键假设以及它们最适合的数据和生物学问题的类型。
在过去的几年中,单细胞 RNA 测序(scRNA-seq)已经成为分子研究中分析基因表达的首选方法3。ScRNA-seq 与批量 RNA-seq 数据相比有几个明显的优势,包括表征每个样品中细胞集合和细胞类型频率的能力4,鉴定每个细胞或细胞类型5内激活的基因和网络的能力以及研究细胞或细胞类型之间关系的能力6。然而,这种数据类型也带来了新的挑战,其中一些适用于单个时间点(“快照”)数据和时间序列数据(例如,需要分析多少个细胞,或者如何分组细胞和分配细胞类型) ,而另一些则是时间序列研究所独有的。例如,在批量研究中,很容易将基因在一个时间点的表达与其在前一个时间点的表达联系起来,但是对于 scRNA-seq 数据,将单个细胞连接在两个连续的时间点之间并不是微不足道的。ScRNA-seq 研究中的另一个挑战是在同一时间点收集的细胞可以代表相对广泛的不同阶段或细胞状态7,因此将所有这些细胞分配到过程中的同一点可能是错误的。在分析这些数据时会出现一些相关的计算问题,包括如何表示随时间收集的大量细胞,如何推断激活的网络和途径,以及如何确定特定事件的确切时间。
虽然已经开发了几种时间序列大量数据的分析和建模方法8,但是许多方法不能直接适用于 scRNA-seq 数据,因为它们不能解决上述挑战。此外,与大量数据不同,即使来自单个样本的快照 scRNA-seq 数据也可以通过轨迹推断或 RNA 速度9(见下文)提供关于过程动态的信息。这导致了几种实验和计算方法的发展,这些方法侧重于利用时间序列 scRNA-seq 数据研究生物过程的动态。这些方法提供了有关事件的时间和顺序的信息,使研究人员能够充分利用 scRNA-seq 数据。这些方法包括改善数据收集方式的实验和计算方法,获得辅助数据分析的补充信息,可视化每个时间点的大量细胞、其轨迹和排序的方法,以及将时间序列 scRNA-seq 数据与其他时间序列和快照数据整合的方法,以重建随时间推移的基因调控和细胞分化模型。
细胞异质性的表观遗传学基础
The epigenetic basis of cellular heterogeneity | Nature Reviews Genetics
基于单细胞测序的基因转录水平分析方法揭示了形态学上难以区分的细胞之间表达水平的显著异质性。这种变异性对于组织生物学和癌症等疾病状态具有重要的功能意义。表观基因组信息如染色质可及性,核小体定位,组蛋白尾部修饰和增强子-启动子相互作用在体细胞和单细胞样品中的映射已经显示染色质状态的这些特征有助于相关基因的表达或抑制。单细胞表观基因组分析方法的进展使得能够对单个细胞的染色质状态进行高分辨率的定位。最近使用这些技术的研究提供的证据表明,染色质组织的不同方面的变化共同定义了高度相似细胞之间的基因表达异质性。