SURVIVOR 合并不同的SV

SURVIVOR 用于模拟/评估 SV、合并和比较样本内及样本间 SV 的工具集。

githup: https://github.com/fritzsedlazeck/SURVIVOR
wikt: https://github.com/fritzsedlazeck/SURVIVOR/wiki

1. 安装

git clone https://github.com/fritzsedlazeck/SURVIVOR.git
cd SURVIVOR/Debug
make

2. 简单操练

为了提高SV的准确性,可以针对每一份样本通过不同版本进行鉴定SV,比如manta, delly等,而后利用SURVIVOR 将每一个软件得到的vcf进行合并。

## 不同软件的vcf放入一个文本
ls *.vcf >sample_files

## merge
SURVIVOR merge sample_files 1000 2 1 1 0 30 sample_merged.vcf

参数

  • 1000表示允许合并的SV间的距离最大为1000bp;
  • 2表示仅输出2个工具均鉴定出的SV;
  • 1表示仅输出2个工具鉴定出的同类型的SV;
  • 1表示仅输出2个工具鉴定出的同方向的SV;
  • 30表示仅考虑长度在30bp以上的SV

一些其他参数

-- Simulation/ Evaluation
        simSV   Simulates SVs and SNPs on a reference genome.
        scanreads       Obtain error profiles form mapped reads for simulation.
        simreads        Simulates long reads (Pacio or ONT).
        eval    Evaluates a VCF file after SV calling over simulated data.

-- Comparison/filtering
        merge   Compare or merge VCF files to generate a consensus or multi sample vcf files.
        filter  Filter a vcf file based on size and/or regions to ignore
        stats   Report multipe stats over a VCF file
        compMUMMer      Annotates a VCF file with the breakpoints found with MUMMer (Show-diff).

-- Conversion
        bincov  Bins coverage vector to a bed file to filter SVs in low MQ regions
        vcftobed        Converts a VCF file to a bed file
        bedtovcf        Converts a bed file to a VCF file
        smaptovcf       Converts the smap file to a VCF file (beta version)
        bedpetovcf      Converts a bedpe file ot a VCF file (beta version)
        hapcuttovcf     Converts the Hapcut2 final file to a VCF file using the original SNP file provided to Hapcut2
        convertAssemblytics     Converts Assemblytics to a VCF file

20240909

发现合并以后的vcf会出现一些SV坐标和reference对应不起来的问题,可以通过bcftools进行检查

bcftools norm --check-ref w --fasta-ref ref.fa SURVIRO.vcf

比如合并之前的位点为:


image.png

image.png

而合并之后的位点为:


image.png
  • 可以看到,虽然用的ID为INS.2412 (其对应坐标为98676691),但是合并后的坐标为98676480 (INS.2411的坐标),从而导致SV和ref序列对应不起来。
  • 还有position可以对应相应的ref和alt序列,但是SV-id却对应不起来。
  • 还有,position,SV-id和序列都对应不起来的情况,这种情况较为少!
    最终利用脚本 fix_SURVIOR_error.py 将其矫正!
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,427评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,551评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,747评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,939评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,955评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,737评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,448评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,352评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,834评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,992评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,133评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,815评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,477评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,022评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,147评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,398评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,077评论 2 355

推荐阅读更多精彩内容