视频来源:https://www.youtube.com/watch?v=WVKlRlCpSjA
RNA sequencing RNA高通量测序技术:了解各种比较条件下,所有基因表达情况的差异
如:正常组织与肿瘤组织、药物治疗前后表达差异、不同发育阶段不同组织之前的差异
最常用:所有mRNA表达量的差异、mRNA可变剪接的差异、融合基因、SNP
RNA-seq测序方法
1. 去除核糖体RNA(rRNA,占抽提总RNA的绝大部分,95%占人体),mRNA只占2-3%,剩下的是ncRNA
-rRNA在人类中很保守,在各组织之间表达量很稳定,测rRNA的意义不大,一般测mRNA
-illumina Truseq RNA 建库方法:
(1)利用带poly(T)探针的磁珠与总RNA进行杂交,吸附其中带poly(A)尾巴的mRNA(高等生物的mRNA都有Poly(A)尾巴),回收磁珠,并把polyA尾巴的mRNA洗下来
(2)将洗脱下来的mRNA用镁离子(Mg2+)溶液进行处理,把mRNA打断
(3)将打断的mRNA片段用随机引物进行逆转录
(4)逆转录合成第一链cDNA后,再合成出第二链cDNA——成为双链cDNA
(5)在双链DNA两端加A碱基,并接上“Y”型的接头,经过PCR扩增,便成为了可以进行分析的mRNA文库
(6)在Hiseq测序仪上进行测序
做 Truseq RNA-seq文库起始总RNA质量要求
1. 在mRNA的大部分片段是完整的状态下,才能有比较好的建库效果
(若mRNA发生降解,磁珠会吸附靠近3‘端的那些断片(而非完整的mRNA))
会洗脱掉一部分的mRNA数据,影响后期的数据分析工作(不准确)
2. 建议在建立文库前进行一次总质检Bioanalyzer
Bioanalyzer 检测18S 28S的电泳峰是否高、尖,来判断RNA的质量——越高越尖,代表降解越少,完整度越高
RNA integrity number(RIN值) 最高十分,最低零分,代表RNA完整度的象征(8.0以上比较好建库)
RNA seq的生物信息学分析
1. 将测到的mRNA片段 mapping(比对)到基因组上(看5'端与3'端片段的数量,也可以判断降解的情况)
RNA 表达量差异分析
1. 表达量差异相对定量值:Read per kilobase of exon model per million mapped reads(RPKM值)
——每一百万条可以比对到基因组上的read当中,有几条是可以比对到某个特定基因的,此数值再除以外显子的长度,得到的最终比值
RPKM含义:某个基因,所表达的mRNA片段与所有被测到的可以Mapping(比对)到基因组上的片段进行比较,因为建库当中mRNA被镁离子溶液打断过,所以要再除以一次外显子的长度(外显子越长越容易被测到,进行一次修正)
RNA表达差异火山图
1. 两个样本RNA的表达量的对比
2. 横轴: 某个基因的表达量是上升,还是下降了 纵轴:这种差异的置信程度 每一个点:同一个基因的mRNA表达量的变化
3. 超过蓝色部分的置信程度很高,可以相信(红色部分)
RNA表达聚类分析:
1. 横轴样本,纵轴基因(样本会根据亲缘进行分类,建树,每个群体内部有相似的表达特征)
Gene ontology 分析(GO分析)
1. 国际化的 基因功能分类体系 ——一整套动态更新的标准词汇、严格定义的概念——全面概括任何生物中基因、基因产物的属性
主要描述基因的三个属性:
1. 此基因参与的生物过程
2. 此基因的产物的功能
3. 基因产物在细胞器中的空间定位
通路分析(Kyoto encyclopaedia of genes and genomes,KEGG):公认、权威的基因功能数据库