批量下载NCBI基因组(mamba安装)
mamba create -n ncbidownload
conda activate ncbidownload
mamba install -c bioconda -n ncbi-genome-download
ncbi-genome-download --assembly-accessions list.csv --output-folder $PWD --section genbank --formats fasta bacteria
ncbi-genome-download参数详解:
命令 | 参数详解 |
---|---|
-h | 显示帮助 |
--assembly-accessions | 将你要下载的基因组信息整理成每列单独一个的ID文件 |
--output-folder $PWD | 保存的文件路径,这里是当前路径 |
--section refseq | 选择数据库,两个参数一个是genebank一个是refseq,默认genebank |
--formats fasta | 下载形成的格式,这里是fasta格式 |
bacteria | 必须参数,设置下载相关基因组的域,空格的形式放在命令最后,也可以换成all |
附录
#搜索目录下所有gz文件复制到现在目录
find . -type f -name "*.gz" -exec cp {} $PWD \;
#统计个数
find . -type f -name "*.gz" | wc -l
#修改名字
for file in *.gz; do
new_name=$(echo "$file" | cut -d '_' -f 1-2)
mv "$file" "$new_name.gz"
done
#将下载的文件导出到一个统计文件中
ls *.gz > check.txt