利用Aspera下载Sra文件
Aspera的下载
wget https://download.asperasoft.com/download/sw/connect/3.6.2/aspera-connect-3.6.2.117442-linux-64.tar.gz
tar zvxf aspera-connect-3.6.2.117442-linux-64.tar.gz
sh aspera-connect-3.6.2.117442-linux-64.sh
~/.aspera/connect/bin/ascp -h
成功后会有如下图示
Sra文件的下载
下载地址:ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/
在NCBI文献中需要的SRA序列 例如
点击Analyse Dataset
点击Reference Series栏的链接(次文献没有相关SRA数据)
如果文献有用到相关SRA
(来自:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE50177)
点击SRA栏目里面的链接会出现相关文献
找到自己感兴趣的并点击进入
会得到SRR文件序号并回到Sra文件下载地址中寻找
好了,回到终端建立一个储存SRA数据库的文件夹
mkdir ~/Seqs
下载刚才找到的SRA文件到Seqs
~/.aspera/connect/bin/ascp -T -i /home/XXX/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -l 200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR957/SRR957676/SRR6957676.sra ./Seqs
#XXX为用户名
如果需要批量下载则可以建立一个txt文件保存多个序列
nano ~/Seqs/sra_list.txt
输入多个SRA序列
/sra/sra-instant/reads/ByRun/sra/SRR/SRR957/SRR954646/SRR957676.sra
/sra/sra-instant/reads/ByRun/sra/SRR/SRR957/SRR957676/SRR957677.sra
按Ctrl+O,Ctrl+X保存退出
批量下载sra_list.txt列表中的文件
~/.aspera/connect/bin/ascp -T -i /home/XXX/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -l 200m --mode recv --host ftp-private.ncbi.nlm.nih.gov --user anonftp --file-list ~/Seqs/sra_list.txt ~/Seqs/
#XXX为用户名