登录注册写文章

RNA-seq原理

RNA-seq原理

测序技术发展：

1977Sanger测序--1996焦磷酸测序--2003cmPCR--2003ZMW---2012纳米孔测序

RNA-seq的一些技术限制，测序误差主要由生物学误差(生物学重复，比如取30只小鼠采样)和技术性误差(技术性重复，比如对1只小鼠采样3次)造成，如果想要得到的数据为无偏的，那么生物学重复最重要，因为生物个体代表着样本，而技术手段只会造成不可控干扰。总的来说，只做技术性重复的实验结果偏差最大，技术性重复+生物学重复的实验结果偏差也可能较大，除非生物学重复远大于技术性重复(因为当生物学重复次数不足时，技术性重复能扩大样本单一的影响)，无论如何，多做生物学重复，这有助于你的结论被其他人复现。

mRNA(DNA转录形成)穿过细胞核进入细胞质进行翻译，然后mRNA和beads结合(基于mRNA的polyA序列)成凝珠进行测序

原理详解：

10x

A 为了保证细胞在标记的过程中是单独分开的，10X开发了微流体设备(microfuidic device)进行预处理，设备有三个上样孔，分别加入你的1.样本细胞悬液(Sample) 2.凝胶小球(Beads) 3.分离液(Oil)，下图为具体设备的示意图。

微流体设备(microfuidic device)

当我们把样本细胞悬液加入设备时，每一个细胞会与凝胶小球单独结合，然后被分离液包裹，形成一个油包水的密闭小液滴(droplet)。进一步地，细胞和凝胶小球相遇不久后会裂解，释放出里面的各种物质，RNA(mRNA、tRNA、rRNA)，蛋白质，脂质，DNA等。实际上Beads上联接了不同的接头，其中有一个接头包含ploy(dT)序列，在细胞裂解后释放的核酸中，只有mRNA带有polyA tail，于是Beads的poly(dT)接头就可以从众多的裂解产物里捕获到mRNA(实际上drop-seq采用3'端测序，就是为了检测polyA tail)。

Master Mix中带有反转录试剂，当mRNA被捕获后，就可以从它的3‘端开始作为模板，进行反转录出cDNA的第一条链，这第一条链就沿着poly(dT)序列延申，长在了beads上，形成了图一7中的STAMPs，接着我们把反转录出来的cDNA序列洗脱，以cDNA的第一条链为模板，进行PCR，合成cDNA的第二条链，然后就是我们熟悉的cDNA扩增以及illumina测序。

如何确定测序序列来自哪个细胞？single cell的RNA-seq和bulk的RNA-seq的最大区别是什么？是barcode，或者说是cell barcode(实际上DNA自带barcode，cell barcode是人为控制的)。每一种single cell的beads上都有着相同的cell barcode(beads与beads间的cell barcode是不同的)，假设每个beads只捕获一个cell，那么则每个cell都被cell barcode 单独标记了。

如何保证每个beads只捕获一个cell？第一是控制cell和beads的流速，第二是beads的数目远远超过cell的数目，即绝大多数的beads都是空的，只有少数的才捕获到了cell。但是还是有个别的droplet里面会两个或者更多的细胞，这就需要进行质控(QualityControl)。

接下来可以参照10X Genomics的说明书详解single cell RNA-seq的barcode。

10X Genomics的cell barcode

实际上beads上一开始只接了Read1、Barcode、Poly(dT)。

名词解释：

Poly(dT): 用来和mRNA的polyA结合，捕获mRNA

UMI: 用来标记不同的PCR产物(用于count计数)。为了减少由于复制引起的误差(重复抽样导致重复计数)，人们在一些单细胞测序的步骤中增加了UMI(unique molecular identifiers)，UMIs 是由 4-10 个随机核苷酸组成的序列，在 mRNA 反转录后，进入到文库中，每一个 mRNA，随机连上一个 UMI，因此可以计数不同的 UMI，最终计数 mRNA 的数量。

10X Barcode: 用来标记不同的single cell

Sample Index: 用来标记不同的sample

P5和P7: 用来进行illumina的桥式PCR测序

Truseq Read 1、2: 用来进行连接beads，cDNA的PCR扩增和加P7接头

在这些序列中，P5、P7、Truseq Read 1、2 的序列是已知的。

其他的序列是怎么一步一步添加上去的？

具体步骤：

步骤1

利用Poly(dT)来捕获mRNA，在mRNA的5'端插入TSO(Template Switch Oligo模板切换低聚糖)引物，然后从mRNA的polyA开始反转录，直至mRNA的DNA序列被转录完成，然后在beads序列的3'端插入CCC，再对mRNA的TSO进行反转录，至此完成了cDNA的第一条链(序列顺序和mRNA逆序)。上述步骤很重要，因为中间cDNA的序列我们是不知道的(仪器测序长度有限)，如果不加上这个接头，就没有办法设计引物来合成cDNA的第二条链。

步骤2

将mRNA溶解，对cDNA的第一条链加入UMI引物，以cDNA的第一条链为模板合成cDNA的第二条链。最后使用PCR(聚合酶链式反应)对cDNA(拷贝DNA)进行扩增(为了富集)。

步骤3

因为II代测序(NGS)的illumina测序不能测很长的seq，约为200-700bp，所以不能测得mRNA全长，因此需要进一步把合成的cDNA利用酶打断到illumina能测的长度(长度有些随机，比如300bp的cDNA能通过头尾150bp完整测序，但700bp的cDNA只能通过头尾150bp测序+参考基因组推断出来)。然后在cDNA的3'端插入Truseq Read2引物(和Truseq Read1引物匹配为头尾，中间序列就是reads)、P5、P7。

详解图

最后的测序数据(reads)从Truseq Read1后的10X Barcode开始，一直到Truseq Read2为止。

PCR扩增是对cDNA单链进行复制，后面的桥式PCR是对完整的样本进行复制(增加数据深度)，总的来说各个cDNA呈均匀分布，然后进行抽样。

RNA-seq duplications有PCR duplication(最主要)、cluster duplication、optical duplication。

实际上仪器会对核苷酸进行染色，然后判断颜色确定ATCG碱基，因此有很多原因会导致机器误判，和后续QC有关。

1.某些核苷酸对颜色附着不明显

2.大片区域颜色相同(相同类型核苷酸)，而其中仅有几个颜色不同的点(不同类型的核苷酸)

scRNA-seq分析

©著作权归作者所有,转载或内容合作请联系作者

禁止转载，如需转载请通过简信或评论联系作者。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 212,454评论 6赞 493
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,553评论 3赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 157,921评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,648评论 1赞 284
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,770评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,950评论 1赞 291
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,090评论 3赞 410
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,817评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,275评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,592评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,724评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,409评论 4赞 333
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,052评论 3赞 316
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,815评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,043评论 1赞 266
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,503评论 2赞 361
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,627评论 2赞 350

推荐阅读更多精彩内容

10x Genomics RNA-seq 原理详解
近期的一系列际遇都再次论证了我真的是一个靠运气闯荡江湖的人，鬼使神差的混入了一个超棒的实验室，并且受到了同伴和室友...
致知_5974阅读 18,457评论 8赞 52
Nature重磅综述 |关于RNA-seq，你想知道的都在这
摘要 RNA测序（RNA-seq）在过往十年里逐渐成为全转录组水平分析差异基因表达和研究mRNA差异剪接必不可少的...
生信宝典阅读 9,178评论 3赞 28
重磅综述：三万字长文读懂单细胞RNA测序分析的最佳实践教程（原理、代码和评述）
原文链接： https://www.embopress.org/doi/10.15252/msb.20188746...
生信宝典阅读 6,369评论 0赞 48
2019-10-03-学习RNA-seq这十年记录
学习生信技能树的RNA-seq这十年（3万字长文综述）首先是目前10年来测序技术的的发展平台的更迭变化我摘抄了...
程凉皮儿阅读 2,156评论 0赞 5
sc-Review：单细胞RNA-seq数据分析最佳实践
Luecken MD, Theis FJ. Current best practices in single-ce...
周运来就是我阅读 8,964评论 3赞 67

24赞25赞

赞赏

手机看全文