RNAseq 作为转录组分析中的比较经典分析方法,现在有很多的分析方法和分析思路从tophat+cufflink 到 hisat2+ballgown每个分析流程都有相应的优点和缺点。
最近读了一篇 Nature Communications 文章
文章从流行的39个工具中组合了120种RNA-seq分析方法,并对分析结果的精确度、效率和一致性三个层次进行了评估。
在文章的最后作者给出了ballgown自己推荐的RNAseq 分析方法 分析流程如图所示,回帖用HISAT2,组装和定量用StingTie,差异计算选择DESeq2。
为了响应这篇文章的分析流程,我从RNAseq原理到分析过程的代码都进行了分享与展示,希望大家能在我的博客中了解到RNAseq其中的过程。
RNA有较多的的种类,其中包括了mRNA、micRNA、lncRNA、circularRNA、enhancer RNA(eRNA)
RNAseq 最主要的特征就是通过测序然后比对鉴定或者找到相应的RNA 针对找到的RNA进行一系列的分析
二代测序原理大家可以移步b站的官方视频:https://www.bilibili.com/video/av13107081
1.下机数据的处理
我们将得到的RNA样品处理好并送往测序公司,经历建库和测序后,一般测序公司返回的结果都是经过质量控制的,但是为了以防万一,最好还是自己质控一遍。
fastqc
fastqc -o outdir -t 8 input.fastq
#-o 输出文件目录
#-t 进程数
我们来看一下测序分析的结果
显然测序的质量还是很好的,可以继续分析过程。
如果测序质量较差的话,用adapter 或者 Trimmomati 对测序进行质量控制
如果你是测序控制过程不是很熟悉的话,推荐使用fastp 质量控制软件
fastp能全套完成质量控制和可视化,很适合初学者使用
详细使用方法可以移步fastp使用方法://www.greatytc.com/p/957371fad4d3
到这里我们就完成了测序质量的控制过程