众所周知,一个公司开通公众号的目的肯定是营销,我们也是(真的)。小编给自己起了个名字“BigM”后就开始想方案。著名的营销学之父Philip Kotler认为“优秀的企业满足需求,杰出的企业创造市场”。
所以BigM觉得先要用通俗易懂的语言,把什么是单细胞转录组测序给大家讲懂了,才能激发你们的需求,创造我们的市场。就这样,我们的第一个系列板块“白话单细胞”诞生了,代号Vernacular(白话)。
通常我们搜索单细胞测序时,十家公司中有九家都会展示封面这张微流控示意图,告诉大家我们用的是最主流且稳定的10x Genomics单细胞捕获技术(当然,奇景生物也是这么做的)。今天咱们的主角就是这张图,先说一说这神奇的微流控技术怎么就能捕获单细胞了?
图1
要捕获单细胞先得准备几样东西,主要是Gel Beads、Oil和要被捕获的细胞们(Cells)。图1中从管道左侧进入的小圆球就是Gel Beads,五颜六色可不是为了好看,而是代表着每个Gel Beads都不一样。
图2
每个Gel Bead表面都长着非常多的小触角(Primer),常用的是图2右侧最上面那种Poly(dT) primer。区分细胞的关键就在图2中绿色的10x BC(Barcode序列标签),同一个Gel Bead上的小触角中Barcode序列完全相同。而图2中橙色的UMI序列标签用于测序后定量,同一个Gel Bead上的小触角中UMI各不相同。Poly(dT)就不用说了,抓细胞中带PloyA尾的那些RNA用的。
图3
万事俱备,只欠东风。这东风来自空气泵,可以将Gel Beads和Cells均匀的沿着不同微流控孔道进行推送,一个Gel Bead遇到一个Cell,最终在油井(图1中Oil in Well)里配对结缘形成“油包水”结构。接下来发生的事情就顺理成章了,Gel Beads释放内部的化学物质使细胞破裂并释放RNA。小触角用Poly(dT)抓住带PloyA尾的RNA,通过反转录形成cDNA,并带上了Barcode和UMI标签(图3)。
测序得到的序列(Reads)中,不仅有RNA序列,还有对应的Barcode和UMI标签。RNA序列与参考基因组比对,确定来自于哪个基因。同时,将这些序列按照Barcode归归类,相同Barcode的序列来自于同一个细胞。另外,还记得吗?Gel Bead上UMI各不相同,如果同一个细胞中的序列有相同的UMI,那大概率是PCR引入的重复,我们只计数一次,矫正计数的准确性。这样,我们就得到了单个细胞维度,不同基因的准确表达量了。
看到这里10x Genomics单细胞捕获的原理差不多讲完了,如果大伙觉得听明白了,请关注+转发,BigM吃个鸡腿以后还能再讲三百回合。想上“提高班”的话,可以留下来再听两句。
10x Genomics技术确实不错,但会出现哪些常见问题?
01 多细胞|细胞们不一定会老老实实的束手就擒,总会做一些捣乱的事情,比如多个细胞和一个Gel Bead配对形成油包水结构。来自多个细胞的RNA,由于具有相同的Barcode,会被认为是单个细胞的RNA表达量,影响后续分析。这样该怎么办呢?
拆招:微流控推送Gel Beads的速率通常会高于细胞,宁愿找不到细胞配对,也别让多个细胞争抢一个Gel Bead。通过这种方法,每一万个细胞中多细胞率通常可以控制在4%以下。除此之外,我们在分析中也可以使用DoubletFinder等软件,从算法上预测多细胞数据,并进行去除。
02 背景噪音|等待被捕获的Cells之间,混有一些游离的RNA。(这种情况如何去除)这些RNA与细胞一起进入油包水结构,并被标记上Barcode和UMI进行测序。甚至油包水结构中没有细胞,而只有游离RNA被捕获测序。
拆招:在样本获取、运输、制备过程中,保证细胞活性,避免死亡或破碎细胞中的RNA游离出来。同时,对于细胞活性较低的样本,我们也可以采用去死细胞的方法对样本进行处理,提高细胞活性。除此之外,在Cell Ranger进行单细胞测序数据分析环节,我们也可以对背景噪音进行去除。
关注+转发,下期“Vernacular|白话单细胞”再约。