最近这段时间一直在开发small RNA的标准分析流程,先Mark一下,随后填坑!
到了填坑的时候了:
Small RNA在测序分析的时候两个关键点分别是:
- miRNA 的鉴定;
- 目标靶基因的预测
今天先讨论 miRNA 的鉴定,也分为两种情况:1. 已知 miRNA的鉴定;2. 新miRNA的鉴定。
miRNA由前体发育为成熟体其过程是经过 Dicer 酶剪切完成的,酶切位点的特异性也使得 miRNA 成熟体序列首位对碱基 U (T) 有很强的偏好性。
另外其他的位点也有一些统计,如:2~4 号位一般缺少 U,第 10 号位偏向于 A (第 10 号位一般是 miRNA 对其靶基因发生剪切作用时的剪切位点)。
另外酶切位点以及其他一些因素影响下最终的 miRNA 成熟体序列一般两端会有不同程度的碱基增添或者缺失,这种现象在 3`端比较普遍些,因此在计算 miRNA 表达的策略上这些因素都应该考虑。
miRNA 鉴定的整体思路是依靠与本物种 miRBase 数据库比对的结果来进行分析的,综合前体和成熟体两方面比对情况得到该物种 miRNA 的表达情况。
我们设置的策略如下:
- 序列能够以无错配的方式完全比对到前体序列;
- 在上述条件下的基础上序列与成熟体比对允许错位,但至少存在 16 个碱基的覆盖,覆盖部分(overlanp)无错配。
满足这两个条件的序列的表达量之和算作该 miRNA 的表达量,针对这部分序列会对其首位碱基偏好性做出统计学验证。