DecontX是一种通过去除RNA测序数据中非细胞信号的工具,它适用于单细胞RNA测序数据和高通量RNA测序数据。
https://github.com/campbio/celda
DecontX的工作原理是基于两个假设:(1)在RNA测序数据中,非细胞信号包含了许多外源性RNA(例如病毒、细菌、寄生虫等)和内源性RNA(例如rRNA、tRNA、miRNA等),这些RNA并不会贡献到真正的细胞类型鉴定和表达定量上;(2)非细胞RNA的比例在样本之间存在差异,因此可以利用这种差异来区分细胞RNA信号和非细胞RNA信号。
DecontX先将RNA测序数据按照基因进行分类,然后利用一系列策略去除外源性RNA和内源性RNA。最后,DecontX使用一个模型来估计每个细胞的非细胞RNA信号占比,并根据这个信号占比来对细胞进行过滤和去除。这样就可以降低样本中非目标细胞的影响,从而提高细胞类型鉴定和表达定量的精度。
DecontX分析做了什么?
- 去除了污染的细胞,细胞数会有减少。
- 矫正了基因表达量,基因表达量矩阵有变化,不再是整数。后续做monocle有一个bug,monocle的输入矩阵需要是整数,这里要做一下取整处理。