gatk4 MarkDuplicates
java -jar picard.jar MarkDuplicates \
I=input.bam \
O=marked_duplicates.bam \
M=marked_dup_metrics.txt
问题记录:
在此步结束之后,会有metrics.txt生成,metrics.txt中的内容讲解可见metric
gatk4 ValidateSamFile
java -jar /software/picard-tools-1/picard-tools-1.103/ValidateSamFile.jar
问题记录:
在检验831panel中的去重之后的BAM文件时出现以下错误:(mode为VERBOSE)
注:用FixMateInformation对去重之后的BAM进行修正后,依然出现这种问题。
后又用SUMMARY模式重新跑,看到以下结果:
嗯,有27876个read 丢失了meta。但是去重的前一步验证BAM时是一切正常的,然后查看了MarkDuplicates的metrics文件,发现以下结果:
原因找到了,因为这27876个read被标记过滤了。所以,是因为,这么多read被过滤了,留下的bam中就有这么多的read找不到他们的meta了。
unpaired read可以这么理解:which did not have a mapped mate pair, either because the read is unpaired, or the read is paired to an unmapped mate.所以这里出现的应该是第二种可能: the read is paired to an unmapped mate。