一.prefetch下载:
安装SRA Toolkit:
1.下载Toolkit:进入下面的网址,选择适合自己电脑的版本下载,网速不好的推荐挂后台,80M左右,不大。
https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software
2.解压安装: tar -zxvf 文件名
$ tar -zxvf sratoolkit.2.10.0-centos_linux64.tar.gz
sratoolkit.2.10.0-centos_linux64/
sratoolkit.2.10.0-centos_linux64/bin/
sratoolkit.2.10.0-centos_linux64/bin/abi-dump
sratoolkit.2.10.0-centos_linux64/bin/abi-dump.2
sratoolkit.2.10.0-centos_linux64/bin/abi-dump.2.10.0
sratoolkit.2.10.0-centos_linux64/bin/abi-load
sratoolkit.2.10.0-centos_linux64/bin/abi-load.2
sratoolkit.2.10.0-centos_linux64/bin/abi-load.2.10.0
sratoolkit.2.10.0-centos_linux64/bin/align-info
sratoolkit.2.10.0-centos_linux64/bin/align-info.2
...
3.配置环境:最好先pwd先查看自己的具体路径,避免出错,配置好之后可以 prefetch -V查看一下是否路径添加成功.
$ ls
sratoolkit.2.10.0-centos_linux64 sratoolkit.2.10.0-centos_linux64.tar.gz
$ cd sratoolkit.2.10.0-centos_linux64/
$ ls
bin CHANGES example README-blastn README.md README-vdb-config schema
$ cd bin
$ pwd
/home/user/test2/sratoolkit.2.10.0-centos_linux64/bin
$ echo 'export export PATH=$PATH:/home/user/test2/sratoolkit.2.10.0-centos_linux64/bin' >> ~/.bash_profile
$ source ~/.bash_profile
$ prefetch -V
/home/user/test/sratoolkit.2.10.0-centos_linux64/bin/prefetch : 2.10.0
4.prefetch 单个数据下载:
以SRR548905为例:
$ prefetch SRR5489805
2020-01-14T05:42:57 prefetch.2.10.0: 1) Downloading 'SRR5489805'...
2020-01-14T05:42:57 prefetch.2.10.0: Downloading via https...
...
5.prefetch批量下载数据:
获取Accession List:
进入NCBI的SRA数据库输入SRP号:
Accession List大概长这个样子:
$ prefetch --option-file SraAccList.txt
下载完成后,文件被存储在默认目录:/home/usr/ncbi/public/sra/
二.wget 下载(推荐):
1.wget 单个数据下载:以SRR5489805为例,建议挂后台,如果网速给力的话就直接下.
获取下载地址:
$ wget https://sra-download.ncbi.nlm.nih.gov/traces/sra60/SRR/005361/SRR5489805 &
[1] 29674
$ --2020-01-14 14:16:05-- https://sra-download.ncbi.nlm.nih.gov/traces/sra60/SRR/005361/SRR5489805
正在解析主机 sra-download.ncbi.nlm.nih.gov (sra-download.ncbi.nlm.nih.gov)... 130.14.250.24, 130.14.250.25, 130.14.250.28
正在连接 sra-download.ncbi.nlm.nih.gov (sra-download.ncbi.nlm.nih.gov)|130.14.250.24|:443... 已连接。
已发出 HTTP 请求,正在等待回应... 200 OK
长度:3491558416 (3.3G) [application/octet-stream]
正在保存至: “SRR5489805.1” 0% [ ] 646,937 188KB/s 剩余 5h 1m
2.wget批量下载数据:
获取下载地址:在Send to下选择Runinfo而不是Accession List:
文件大概长这个样子:
然后把这些下载地址保存在一个新的文件中:
然后利用wget -i 文件 直接下载:
$ nohup wget -i download_path.txt &
[1] 30328
$ nohup: 忽略输入并把输出追加到"nohup.out"
SRA数据的下载方式还有很多,但是我个人比较推荐wget直接下载,挂后台稳定高效,大家也可以搜索一下其它的下载方式,找到一个适合自己的。
SRA数据下载就只能分享这么多了,希望各位大佬多多批评指教。
下一期预告:SRA数据(2)------SRA数据处理