数据质控:fastqc
fastqc软件可以对fastq格式的原始数据进行质量统计,评估测序结果,为下一步修剪过滤提供参考
fastqc的常用参数
- -h 打印fastqc的帮助信息
- -o 设置输出目录,此文件夹一定要存在,否则无法生成结果;若不设置此参数,默认将结果输出到文件所在文件夹
- -j 制定Java的路径,否则Java命令存在于系统环境变量 PATH中
- -f 制定输入格式,默认为fastq,可选格式为:bam、sam
- -t 线程数
- -v 软件版本信息
- -d 存放质控过程中产生的临时文件,如不设置,则使用系统的临时目录
#创建储存输出结果的文件夹
mkdir qc
#创建文件夹地址变量
fqdir=/trainee2/Mar7/rna/project/fq
qcdir=/trainee2/Mar7/rna/project/qc
#多个数据质控
fastqc -t 10 -o ${qcdir} ${fqdir}/SRR*.fastq.gz
#######################分割线#######################
# 如果样本比较大,用vim写脚本,然后挂到后台
vim qc.sh # 在脚本里写入命令,命令里含有自定义变量,也要写到脚本里
fqdir=/trainee2/Mar7/rna/project/fq
qcdir=/trainee2/Mar7/rna/project/qc
fastqc -t 10 -o ${qcdir} ${fqdir}/SRR*.fastq.gz
touch finished.ok #任务结束后的提示
# 挂到后台
nohup sh qc.sh >qc.log &
multiqc整合fastqc结果
multiqc *.zip
#也可以用vim写在前面的命令脚本里