分析步骤
Hi-C的优势在于其结合了二代测序,这势必也使得其数据分析相对复杂了。目前比较成熟的数据分析流程大致包含6个步骤:
(1) 前期raw reads过滤(跟一般二代测序数据处理基本一致)
(2) 序列比对。建议采用pair-end测序模式
(3) 定位酶切位点。比对寻找到reads pairs在基因组物理位置之后,通过插入片段大小的限制搜索reads pairs两端每条read所对应的最近的酶切片段。酶切片段的位置代表了DNA交互产生的大致位置
(4) 筛选出有效的比对片段。配对的reads位于酶切位点两端且mapped的方向相反
(5) 整合DNA 片段交互强度。
(6) DNA片段交互矩阵标准化。
分析流程可如下图所示:
作者:LeoinUSA
链接://www.greatytc.com/p/94cd5a8e829e