组装细菌基因组

上Genome Announcements网站(https://mra.asm.org/)找一篇细菌基因组文章;找到文章记载的SRA号;

捕获.JPG

2.JPG

  • 从SRA数据库上用prefetch下载该文件;
    语法如下:
mkdir bacterial_genome
 cd bacterial_genome
prefetch SRX6871076

运行结果:


捕获.JPG
  • Fastq-dump解压;
    语法如下:
fastq-dump ---gzip -split-files ~/ncbi/public/sra/SRX6871076.sra

运行结果:


2.JPG
  • Fastqc质控;去接头;
    语法如下:
 fastqc SRX6871076_1.fastq.gz
 fastqc SRX6871076_2.fastq.gz
mkdir trim
java -jar ~/Biosofts/Trimmomatic-0.38/Trimmomatic-0.38/trimmomatic-0.38.jar PE -phred33 SRX6871076_1.fastq.gz SRX6871076_2.fastq.gz ./trim/output_forward_paired.fq.gz ./trim/output_forward_unpaired.fq.gz ./trim/output_reverse_paired.fq.gz ./trim/output_reverse_unpaired.fq.gz ILLUMINACLIP:/home/Biosofts/Trimmomatic-0.38/Trimmomatic-0.38/adapters/TruSeq2-PE.fa:2:30:10 SLIDINGWINDOW:5:20 LEADING:20 TRAILING:20 MINLEN:75

运行结果:


捕获.JPG

对匹配上正向反向的序列再次用fastqc,语法如下:

fastqc output_forward_paired.fq.gz
fastqc output_reverse_paired.fq.gz
  • Spades组装基因组草图;
    语法如下:
 spades.py --careful --pe1-1 SRX6871076_1.fastq.gz --pe1-2 SRX6871076_2.fastq.gz -o ./SPAdesout_9209170_new

结果如下:


捕获.JPG
  • Quast评价组装的基因组效果
quast.py ~/bacterial_genome/SPAdes_out_SRX6871076/contigs.fasta -o ~/SPAdes_out_SRX6871076/quast_out

出现以下问题


1.JPG

尝试了更改虚拟机设置内存重新开机后,结果如下:


![3.JPG](https://upload-images.jianshu.io/upload_images/19791124-71ee87a9a40c4719.JPG?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容