这些小bug折磨了我两天时间才解决,决定以后跑流程要洗心革面,从原始数据就得仔仔细细欣赏,每一个参数尽量搞懂,能用google搜错的一定不用百度。
每逢demux summarize报错信息是酱紫的,没看懂,就各种试错。
最后发现问题是从NCBI下载的原始数据fastq有bug,每个文件最后都多了一个空行,心痛。
gunzip SRR6651857.fastq.gz #解压
wc -l SRR6651857.fastq #发现都是157009行这种奇数
#后期qzv中显示sequence counts是该数除以4
tail SRR6651857.fastq #发现空行
sed '157009d' SRR6651857.fastq>dSRR6651857.fastq #将最后一个空行删除并重新输出
gzip dSRR6651857.fastq #重新封印
重新做人版Qiime2流程
0.启动
根据版本自行启动
source /share/disk5/lianm/basic_tool/anaconda3/bin/activate qiime2-2019.7
source activate qiime2-2019.10
0.1.是否有barcode
补充
1.原始数据的导入(区分双端、单端)
(1)单端
合并后导入有至少三种方式,一般下机数据选择manifest版,但是整这个manifest文件可能会被报错气死。
qiime tools import --type 'SampleData[JoinedSequencesWithQuality]' --input-path manifest --output-path single-end-demux.qza --input-format SingleEndFastqManifestPhred33V2
(1)--type常见类型#qiime tools import --show-importable-types
SampleData[JoinedSequencesWithQuality]
SampleData[PairedEndSequencesWithQuality]
SampleData[SequencesWithQuality]
SampleData[Sequences]
(2)--input-format常见类型,末尾有木有V2我真不知道 # qiime tools import --show-importable-format
SingleEndFastqManifestPhred33V2
SingleEndFastqManifestPhred64V2
PairEndFastqManifestPhred33V2
PairEndFastqManifestPhred33V2
重点是manifest文件,官方说明是tab分隔,特定语法,但我仍是一直报错,显示case sensitive 和case insensitive的一堆,以后大批量生成应该代码直接\t分隔
!版本1
qiime tools import --type 'SampleData[JoinedSequencesWithQuality]' --input-path /share/disk5/zhuqh/4_hospital/manifest --output-path /share/disk5/zhuqh/4_hospital/single-end-demux.qza --input-format SingleEndFastqManifestPhred33V2
qiime tools import --type 'SampleData[SequencesWithQuality]' --input-path /mnt/data/kex/hospital/manifest --output-path /mnt/data/kex/hospital/single-end-demux.qza --input-format SingleEndFastqManifestPhred33V2
#单端具体用哪个
(2)双端
用到再补充