细菌质粒相比较于细菌染色体基因非常容易发生水平转移,质粒可从环境中获得质粒或丢失掉。质粒的存在往往有利于细菌的生存,,质粒上常常带有抗生素抗性基因,毒力基因以及解毒基因,是细菌适应不同环境的结果。
高通量测序的蓬勃发展使人们更容易获得细菌的全部遗传信息,但基于二代测序技术组装出完整质粒还比较难,组装策略主要有de novo based方法和reference-mapping-based方法,今天学习一下reference-mapping-based方法的质粒组装,主要是通过将二代测序数据mapping到已有的高质量质粒数据库辅助组装质粒, 这次使用plasmidID软件,其他质粒组装软件见「生信软件」细菌质粒组装。
1.plasmidID软件安装
直接使用conda安装
(base) czh@ubuntu16:~$ conda create -n denovo_genome plasmidid
2.plasmid 数据库下载
质粒数据库来至于文章“A Curated, Comprehensive Database of Plasmid Sequences”
3.plasmidID软件使用
plasmidID -1 BD4A.IS500_Clean.1.fq.gz -2 BD4A.IS500_Clean.2.fq.gz -d '/home/czh/Desktop/02_BD177_compare_genome/08_BD177_plasmid/plasmid_database/0305_2018_All_plasmids.fna' -s BD177_plasmid -c BD177.fna -o BD177_plasmid --config-directory BD177_plasmid -T 4