SOAPdenowo

SOAPdenovo是一个新颖的适用于组装短reads的方法,能组装出类似人类基因组大小的de novo草图。该软件特地设计用来组装Illumina GA short reads,新版本减少了在图创建时的内存消耗,解决了contig组装时的重复区域的问题,增加了scaffold组装时的覆盖度和长度,改进了gap closing,更加适用于大型基因组组装。(SOAPdenovo是为了组装大型植物和动物基因组而设计的,同样也适用于组装细菌和真菌,组装大型基因组大小如人类时,可能需要150G内存。)

有趣的是,大部分的short read比对工具都是由中国人写出来的。因此可以说华大基因(BGI, Beijing Genomics Institute, Chinese Academy of Science)是中国NGS测序技术的摇篮。

速度上较有优势的short read(短序)比对工具最早出现的是SOAP(表1)。它很好地解决了一个问题,那就是如何在小内存(4G)的机器上将短序比对至人类基因组这样的大数据上去。我们都知道,人类基因组的大小为3.2G(表2),光把这样大的数据读入内存都是一件不太容易的事情。所以SOAP对NGS的贡献是值得我们记住的。SOAP在设计之初是针对single-end reads,所以对paired-end的支持不被大家看好。它的成功也逐步被后起之秀所掩盖。


SOAPdenovo组装软件介绍:

官网:http://soap.genomics.org.cn/soapdenovo.html#intro2

可下载地址:https://github.com/aquaskyline/SOAPdenovo2

论文:

《SOAPdenovo2:an empirically improved memory-efficient short-read de

novo assembler》https://wenku.baidu.com/view/6fa2546069eae009581becd3.html?re=view###

Ruiqiang Li, et al. De novo assembly ofhuman genomes with massively parallel short read sequencing. 2009,GenomeResearch.

软件使用:

SOAPdenovo可以一步跑完,也可以分成四步单独跑

一步跑完的脚本:

./SOAPdenovoall -s config_file -K 25 -R -D 1 -d  -ograph_prefix 1>ass-K25.log 2>ass-K25.err

四步单独跑的脚本:

./SOAPdenovopregraph -s config_file  -K 25 -R -d 1 -p-o graph_prefix  >pregraph.log

./SOAPdenovocontig   -g graph_prefix -R -D 1 -M1  >contig.log

./SOAPdenovomap      -s config_file  -g graph_prefix -p  -f >map.log

./SOAPdenovoscaff    -g graph_prefix -F -u -G -p>scaff.log

d.  输出文件

组装结果文件:

*.contig            #没有使用mate pair 信息的contig

sequences 。

*.scafSeq           #SOAPdenovo软件最终的组装序列结果,可用于后续研究。

*.scafStatistics       #contigs和scaffolds的最终统计信息。

组装过程中产生的其他文件,详见官网:

*.kmerFreq        #每行显示一个数,这个数是kmer值出现的频率等于行号的kmer个数。

http://soap.genomics.org.cn/soapdenovo.html#intro2


Anillustration of relationships between alignment methods.


·The applications / corresponding computational restrictions shownare (green) short pairwise alignment / detailed edit model;

·(yellow) database search / divergent homology detection;

·(red) whole genome alignment / alignment of long sequences withstructural rearrangements;

·and (blue) short read mapping / rapid alignment of massive numbersof short sequences. Although solely illustrative, methods with more similardata structures or algorithmic approaches are on closer branches.

·The BLASR method combines data structures from short read alignmentwith optimization methods from whole genome alignment.


SOAP是有其比对上的优势的,可以看出,SOAP对错误率的容忍较高,对indel的容忍也很好,这就是我现在需要的,可以尝试一下用SOAP将二代比对到三代上


参考:

http://teacher.bmc.uu.se/costuppsala2012/COSTUPPSALA2012/Lectures_files/SOAPdenovo-COST-XiaodongFANG-BGI.pdf

http://www.life.umd.edu/labs/delwiche/bsci348s/lec/Genomics.html

Jason R. Miller et al., Assembly algorithms

for next‐generation sequencing data. Genomics

Li R, et al. De novo assembly of humangenomes with massively parallel short read sequencing. Genome Research (2010).

http://blog.sina.com.cn/s/blog_5d1edf6a0100w56l.html

http://blog.sina.com.cn/s/blog_78c527410102w7ek.html

http://blog.sina.com.cn/s/blog_14ece68cc0102wagf.html

https://www.cnblogs.com/leezx/p/5606373.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,602评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,442评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,878评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,306评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,330评论 5 373
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,071评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,382评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,006评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,512评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,965评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,094评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,732评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,283评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,286评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,512评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,536评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,828评论 2 345

推荐阅读更多精彩内容