写在前面:
Manta作为一款结构变异检测的软件,它最显著的特点就是快,官方声称其分析用时不到其他软件的十分之一,一般的WGS分析能够在2个小时内分析完成。Manta利用成对的read和截断的read信息进行SV检测,支持germline和somatic (tumor-nomal sample pairs) 结构变异的检出。除了可以广泛应用于WGS分析,Manta多加几个参数就可以方便的用于target区域的SV检测了。
检测target区域所需参数:
--callRegions 该参数后接BED.gz压缩文件
BED文件在使用 bgzip 命令压缩后,还需要用 tabix 命令创建索引,放在BED.gz文件的同一路径下,这点跟Strelka很像。准备方法如下:
bgzip BED > BED.gz 生成bed.gz用于tabix构建索引
tabix -p bed BED.gz tabix 构建索引,生成bed.gz.tai
--exome
这个flag可以取消为WGS设计的高深度过滤(high depth filters), 该过滤是为了改善中心粒周围reads堆积而设计的,对于target区域和全外显子检测是不适用的。
--config 该参数后接修改后的config文件
Manta的默认参数文件是为WGS设计的,在检测target区域的情况下,可以通过修改参数文件提高敏感性。参数文件的默认位置:${MANTA_INSTALL_PATH}/bin/configManta.py.ini 。不建议直接修改该文件,因为这里面的参数是每次运行都要调取的,建议将该文件备份后,修改备份文件,并将备份文件加在--config后面。需要修改的参数如下:
# Remove all edges from the graph unless they're supported by this many 'observations'.
# Note that one supporting read pair or split read usually equals one observation, but evidence is sometimes downweighted.
minEdgeObservations = 2
# Run discovery and candidate reporting for all SVs/indels with at least this many spanning support observations
minCandidateSpanningCount = 2
增加了以上参数设置,target区域的检测基本就大功告成了。Manta的速度果然快的感人,CREST一天都没有跑完的流程,它只用了几十分钟。。。当然检出的结构变异数量也相差比较大,待比较完结果再更。
参考:
https://github.com/Illumina/manta/blob/master/docs/userGuide/README.md#exometargeted