造血分化是从造血干细胞分化为具有不同功能的细胞过程,在成人中主要发生在骨髓,最终产生淋巴系细胞,髓系-粒系,红系等细胞类型,是研究干细胞分化、肿瘤免疫、血液疾病等的良好模型。造血分化过程是一个复杂、多阶段的,受多种因子调控的过程,单细胞多组学分析有助于解析造血干细胞转录和细胞命运异质性的顺式和反式调节机制。
论文的通讯作者为斯坦福大学William J. Greenleaf 教授,他的课题组在2013年Nature Methods上发表第一篇ATAC-seq技术性文章(Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position),这个技术具有操作简单,成本低,时效性快等特征,很快被科学界所接受,有关染色质开放程度及表观调控相关的研究逐渐流行起来。
论文设计从健康人捐赠的骨髓中分选单个细胞进行scATAC-seq,经过细胞捕获,转座酶结合,PCR扩增和测序,得到造血系统10个细胞类型的染色质开放图谱,进行了常规的单细胞处理分析流程,获得了2034个高质量细胞数据,每个细胞fragments中位数为8268,比对到peaks的比率为76%。值得一提的是之前常规的motif分析流程,一般首先获取差异peak,然后用homer等软件预测motif,再结合TF 数据库,处理转录因子footprint等分析;这里使用的greenleaf 实验室自己开发的ChromVAR工具,这是专门用于分析chromatin accessibility 的一个具有多种功能的R包,其中之一就是鉴定不同细胞的TF motif。
然后用多种方法对鉴定出得TF motif聚类,TF Z scores 聚类和TF Z score 与t-SNE结合聚类的方法都存在缺点:前者不容易鉴定chromatin accessibility 与其他生物变量间的关系,如细胞周期,细胞间的信号依赖;后者对细胞间距离难以解释;因此文章中又采用了新的算法-reference guided approach,即基于bulk sample 的chromatin accessibility 和相关的调控元件。首先对bulk ATAC-seq sample进行主成分(PC)分析,然后对PC在单个细胞中比例进行打分,最后根据PCs标准化后的分值与其他细胞的相关系数进行聚类。这个方法对后续研究具有重要参考意义。
不知道细胞表面分子标记物,利用k-medoids clustering对PC分析中的前5种主要成分聚类。研究分析鉴定出14个亚群,其中CMPs细分为4个亚群,GMPs分为2个亚群,表明这类细胞存在一定的异质性。
具体研究各谱系细胞分化连续轨迹,细胞层面揭示了血细胞分化过程。
对HSC,CMP,GMP进行单细胞RNA测序,同时使用他人关于monocyte scRNA-seq数据,基于 reference-guided 方法 配对 scATAC-seq 和 scRNAseq profiles 。根据这种方法,他们将髓系分化基因的动态表达映射到染色质的动态变化,并且发现了已知的髓系分化调节因子的预期表达模式。还将TF的表达与TF motif对比。这种方法对于多组学整合分析也提供了思路,既具有借鉴意义。
共发现了14,005个顺式调控元件,这些调控元件随着染色质开放状态的变化也呈现显著的异质性,研究远端调控元件(增强子)与基因表达的相关性,结合染色质构想捕获技术HiC证实形式环可以促进调控元件与基因的结合。
DNA的物理可接近是染色质高度动态过程,在建立和维持细胞特征方面发挥着重要作用。基因组可接近染色质的组织形式反映了可能的物理性相互作用网络。在这个网络中,增强子、启动子、绝缘体和染色质结合因子共同作用,调节基因表达。这种可及性情况会随着外部刺激和发育的变化而动态变化。新的证据表明,可及性的稳态维持本身是通过染色质结合因子和核小体之间的竞争相互作用来动态调节的。
和RNA-seq类似,通过对单分子和单细胞可及性的检测表明,对细胞群体的可及性检测代表不同分子状态的整体平均值。当观察一个潜在的、动态的、不同步的过程时,这种分子异质性自然会出现。例如,在转录位点,RNA聚合酶及其他TF一起,置换TSS上游的核小体,并移动启动子下游位置良好但不稳定的核小体。对单分子NOMe-seq数据的足迹分析揭示了这一过程,随着转录过程的展开,捕捉每个分子状态。尽管会受采样效率的影响,但是单细胞可及性检测与对整个基因组调节区域的预测得到相似的分子异质性结果。
参考材料:
http://greenleaf.stanford.edu/index.html
http://geneskybiotech.com/sup/research/1344.html
//www.greatytc.com/p/ae4fe0a4b208
http://www.biodiscover.com/news/research/733290.html