root用户的命令行以#开头
目录 文件命名:
由字母,下划线,数字组成,不要以数字开头,不要使用特殊符号
下划线命名法:project_backup
峰驼法:projectBackup
3.数据下载
Aim:airway数据下载
由文献得到GEO accession:GSE52778
GEO数据库内搜索 得到
BioProject:PRJNA229998
SRA:SRP033351
方法一:sra-tools工具:在SRA数据库使用SRA编号 得到AccList
得到SRR编号,使用sra-tools工具包的prefetch命令下载数据
法1.用已下载好的数据
法2..sra-tools工具包的prefetch命令(官方工具)
# 使用prefetch命令下载单个文件:如SRR1039510
prefetch SRR1039510
# 批量下载:建立循环,并查看
# =号两边没有空格
outputdir=/teach/project/Human-16-Asthma-Trans/data/rawdata/sra
cat sampleId.txt | while read id
do
echo "prefetch ${id} -O ${outputdir} "
done >download.sh
# 运行脚本,由于服务器资源有限,运行不报错就好了,ctrl+C强制退出
nohup sh download.sh >download.log &
# 验证数据的完整性
vdb-validate SRR1039510
方法二.使用aspera下载(推荐)
aspera下载:使用BioProject编号在ENA数 据库得到aspera下载链接
tax id:物种编号缩写,人是9606
scientific_name:Homo sapiens 人的物种的拉丁文
library layout:paired双端测序