右击,选择View as pairs,右击选择Color alignments by,选择read strand
发现:双末端测序中两条reads的颜色只是为了区分在基因组中位置的先后,蓝色并不代表Second in pair,红色并不代表First in pair。红色表示比对到了DNA双链中上面这条链,即正链,注意不是正义链,蓝色表示比对到了DNA双链中下面这条链,即负链
从右向左转录的基因,First in pair往往是左面这条reads,Second in pair往往是右面这条reads;
从左向右转录的基因,First in pair往往是右面这条reads,Second in pair往往是左面这条reads。
也就是说双末端测序,第一次测得是反义链,第二次测得是正义链。这应该就是链特异性建库。
参考文章:从IGV的可视化结果看链特异性建库 - 简书 (jianshu.com)
1. 再看Htseq计数时,-s参数的选择
htseq-count -s reverse/yes(看反义链)
1.1 no
For stranded=no, a read is considered overlapping with a feature regardless of whether it is mapped to the same or the opposite strand as the feature.
如果选择no,不管方向如何,只要在这区间都会认为是这个基因。如果两个基因转录方向相反,而又有部分区域重叠,这种方法就认为比对到这个区域内的这部分reads是__ambiguous,选择默认参数的话就不会统计。所以不够准确。
1.2 yes
For stranded=yes and single-end reads, the read has to be mapped to the same strand as the feature. For paired-end reads, the first read has to be on the same strand and the second read on the opposite strand.
如果选择yes,单末端测序,reads必须与该feature的转录方向相同,双末端测序,第一条reads必须与feature的转录方向相同,第二条reads必须与feature的转录方向相反
1.3 reverse
For stranded=reverse, these rules are reversed.
如果选择reverse,单末端测序,reads必须与该feature的转录方向相反,双末端测序,第一条reads必须与feature的转录方向相反,第二条reads必须与feature的转录方向相同。
最后谈谈正链和正义链。
正链一般是固定的,DNA双链中上面这条链就是正链(+)。
正义链是相对的,它是依据基因的转录方向看的,向右转录(👉)的基因,正链即是它的正义链或有义链或非模板链,向左转录(👈)的基因,负链即是它的正义链。