前言
首先,对3个R包进行简单介绍。
methylkit:用于高通量亚硫酸氢盐测序的DNA甲基化分析和注释的R包。该包的目的是处理RRBS以及WGBS的测序数据。此外,也可以处理从Tab-seq或oxBS-seq获得的5hmC的碱基对分辨率数据。
DSS:该软件包专为高通量测序数据的差异分析而设计,依赖于bsseq包。它提供了用于分析RNA-seq 差异表达和亚硫酸氢盐测序 (BS-seq) 差异甲基化的功能。DSS 的核心是一个基于分层贝叶斯模型的程序,用于估计和缩小基因或 CpG 位点特异性分散,然后进行 Wald 检验以检测差异表达/甲基化。
dmrseq:这个包建立在bsseq包的基础上,bsseq包提供了亚硫酸氢盐测序数据的有效存储和操作以及对差异甲基化cpg的推断。dmrseq的主要目的是检测差异甲基化区域或CpGs。
功能比较
功能 | methylkit | DSS | dmrseq |
---|---|---|---|
生物学重复 | 不需要 | 不需要 | 需要 |
筛选DML/DMR | fisher精确回归/逻辑回归 | wald检验 | GLS回归模型 |
DML | ✔ | ✔ | × |
DMR | ✔ | ✔ | ✔ |
注释 | ✔ | × | × |
可视化 | ✔ | ✔ | ✔ |
methylkit没有生物学重复时使用fisher精确回归,有生物学重复时使用逻辑回归。
methylkit的可视化比较丰富且好看,其他两个的可视化不多还不好看。
注释
3款R包的差异甲基化区域的筛选结果都可用于后续注释,注释一般用chipseerker包或者genomation包。methylkit注释用的是genomation包。
比较推荐chipseerker包,注释结果的输出和可视化都很好,但是无法对cpg岛进行注释。genomation包可注释cpg岛。