SRA公共数据下载

下载安装SRA Toolkit

网址:https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit

#下载
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/version/package_for_your_server.tar.gz
#解压
tar -zvxf package_for_your_server.tar.gz
#更新环境变量
vi ~/.bashrc
export PATH='/path/to/sratoolkit/bin:$PATH'
alias prefetch='/path/to/sratoolkit/bin/prefetch' #不然会报错no such file or directory
source ~/.bashrc

查找数据集ID

一般在文章Methods或者Data Availability部分

建立Accession List

点击这里方便批量下载

点击建立全部数据的列表

如果只需要一部分数据也可以自行勾选

分割Accession List

如果数据太多,可以分开成几个列表同时下载,加快速度

split -l 10 -d SraAccList.txt SraAccList_ #每10行切一刀,前缀SraAccList_,后缀2位数字

得到

SraAccList_00
SraAccList_01
...
SraAccList_21

下载数据

cd path/to/save/files
nohup prefetch --option-file SraAccList.txt --max-size 400G > sra.log 2>&1 &
#默认max-size是20G,如果够了就不用改
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容