系统学习单细胞转录组测序scRNA-Seq(二)

刘小泽写于19.3.16
看了一篇综述，又加了一些扩展知识

文章

这是一篇2017发表在Genome Medicine上的文章A practical guide to single-cell RNA-sequencing for biomedical research and clinical applications

背景

单细胞测序：《Nature Methods》2013年度技术；《Nature》2017年7月刊的封面推荐；《Science》2018十大科学突破榜首
研究细胞的方法：基因组DNA序列（碱基如何排列、各个序列的丰度）、染色质结构（常听说的3C、4C、5C、HiC等）、mRNA序列（排列与丰度）、非编码RNA、蛋白表达、蛋白修饰、细胞代谢【因此不只有scRNA，还有sc基因组、sc表观组】
一个细胞中的待研究分子是微量的，因此我们一般使用几千细胞或直接取组织（上千万甚至上亿），这样就可以积累足够的分子信息，可以开展 Genome-wide association studies (GWASs) 、鉴定SNPs
主要做什么：分离新细胞亚群、构建细胞间互作网络、体内与体外实验反应、细胞在不同器官的情况、不同人群比较、不同物种比较
总体≠个体：细胞异质性的存在（受精卵发育成个体，最终去向十分多样=》肌肉细胞、神经细胞等等，why？；肿块中心、周围、转移中的细胞各异，分离出来判断疗法有效性）
挑战：同时检查单个细胞中表达的数千种蛋白质（蛋白组研究范畴），这个完整性有待提高

名词

Barcoding

之前做单细胞，真的是一个个细胞取出来，然后独立构建文库测序（比如：流式细胞术、激光捕获显微切割LCM=》组织切片），但是这通量非常低（有点Sanger测序和二代测序对比的感觉）。
后来发展出高通量的方法，主要是给每个细胞加上独一无二的DNA序列（就是条形码barcode，就是为了识别），然后测序时将相同的barcode序列归为同一个细胞来源
单细胞转录组可以在polyT引物5'端加上barcode；单细胞基因组目前主要利用高效转座酶（transposase）Tn5实现

Spike-in

Spike-ins can be used for assessing the level of technical variability and for identifying genes with a high degree of biological variability
每个细胞都是独特的，和普通的Bulk RNA-seq不同，材料不容易获得，不太好做重复，因此通过生物学重复来评价技术手段/数据质量的方法不靠谱。
但是数据质量还是需要评价的，那么就通过向每个细胞裂解液中加入已知序列与一定数量的合成mRNA，例如 external RNA control consortium (ERCC)【翻译的话，姑且翻译成：外源RNA对照联盟】开发的“内参”，可以根据RNA读数判断样本间差异
高ERCC含量与低质量数据相关
但是使用spike-in也有一些问题要注意：
- has to carefully calibrate the concentration that results in an optimal fraction of reads from the spike-ins
- spike-in mixes are sensitive to degradation
- captured less efficiently than endogenous transcripts
- Spike-in不适用于droplet-seq的方法
UMI( Unique molecular identifier )
- barcoding的变体，待扩增的RNA分子用随机n-mer寡核苷酸标记。设计不同标签的数量，大大超过待扩增的转录本，产生独特标记的分子，并允许控制扩增偏差【例如10-mer的UMI，就会有 4的十次方 约等于100万种变化】
- UMI是一段随机序列，每一个DNA分子都有自己的UMI序列。可以大大降低PCR误差（比如：原来两个样本中某基因表达量相同，但是由于两个样本扩增效率不同，样本1为99%，样本2只有95%，那么同时扩增40个循环，这同一个基因就有了0.99^40 / 0.95^40 = 5.2倍差异，因此本来没有差异也会因为外界因素扩增效率的影响而产生“假阳性”）
- UMI只用在3'转录本测序的方法中，如CEL-seq2, Drop-seq, MARS-seq

Dropout

基因在一个细胞中有表达，但在另一个细胞中未检测到（按照道理，每个基因应该都可以检测到，只是表达量多少）
可能源于RNA总量少导致扩增建库丢失或者 RNA表达随机性

Mass cytometry

基于流式细胞法和质谱，其中使用元素标签标记的抗体检测蛋白质表达 - 允许在一次实验中对数千个单细胞上的数十种蛋白质进行平行测定

Split-pooling

(Rosenberg et al. ) combinatorial barcoding to profile single-cell transcriptomes without requiring the physical isolation of each cell
https://www.rna-seqblog.com/split-seq-single-cell-profiling-with-split-pool-barcoding/

Basic step

The first, and most important, step in conducting scRNA-seq has been the effective isolation of viable, single cells from the tissue of interest
Next, isolated individual cells are lysed to allow capture of as many RNA molecules as possible.
Next, poly[T]-primed mRNA is converted to complementary DNA (cDNA) by a reverse transcriptase.
Then, amplified and tagged cDNAfrom every cell is pooled and sequenced by NGS.

Types of material

理论上，任何真核生物细胞都可以
Primary cells
- 胚胎 embryo
- 肿瘤 tumours
- 神经 nervous system
- 造血 haematopoietically derived cells
The Human Cell Atlas
- 2017年启动，“媲美人类基因组计划”，核心技术=》单细胞组学
- 对人类37万亿个细胞进行细胞采集、分类和绘图，侧重描绘组织，而不是整个器官；后期阶段可以纳入器官及感兴趣的疾病小群体
- 2018.3.8，Sanger研究所宣布人类发育细胞图谱（Human Developmental Cell Atlas ，HDCA）的初步项目25万个发育细胞测序完成

补充：测序平台

10X Genomics
- 2016.2推出 Chromium；
- 通量高（7分钟内完成100~80,000个细胞的捕获），周期短，成本低，细胞捕获效率高（单个样本细胞捕获率高达65%）；细胞活性要求>90% =》适用于发现新细胞
- 横向孔道逐个导入凝胶微珠Gel beads =》 第一个纵向道输入细胞 =》Gel吸附细胞=》微流控技术送到第二个纵向通道（“油tube”）=》油滴GEMs 【因此，一个油滴就是一个Gel bead，也就是一个细胞】=》收集到EP管 =》每个Gel bead表明都放满了各不相同的Barcode和UMI序列+polyT =》细胞裂解，polyT抓取mRNA的3'polyA
BD Rhapsody
- 分子标签技术（每个转录本标记特异性分子标签）=》单细胞水平上基因表达谱的绝对定量
- 单次实验可制备100-10000个单细胞文库
- CytoSeq特有的蜂窝板技术（20W+的微孔），避免了10X中存在的概率碰撞影响捕获效率问题
- 可以多样本混合捕获；成像系统；转录组-蛋白组联合分析
Wafergen公司 ICELL8
- 基于微流控芯片，5184个反应孔
- 每次运行可分离500-1000个细胞
- 捕获效率为30%，成本相对较低
Fluidigm公司C1
- 通量低、成本高（2000-3000细胞需要18000-100000美元）、周期慢
- 同时捕获96个细胞
- 全长转录组
llumina Bio-Rad
- ddSEQ
- 一次性检测8个样本，每个样本可以得到500~10000个细胞
- 组织功能、病情进展和治疗反应方面的协同作用
- 捕获效率低，仅为3%；成本低
1CellBio => InDrop
Dolomite => µEncapsulator

欢迎关注我们的公众号～_～　　
我们是两个农转生信的小硕，打造生信星球，想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到jieandze1314@gmail.com

Welcome to our bioinfoplanet!

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 211,265评论 6赞 490
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,078评论 2赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 156,852评论 0赞 347
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,408评论 1赞 283
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,445评论 5赞 384
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,772评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,921评论 3赞 406
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,688评论 0赞 266
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,130评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,467评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,617评论 1赞 340
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,276评论 4赞 329
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,882评论 3赞 312
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,740评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,967评论 1赞 265
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,315评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,486评论 2赞 348

系统学习单细胞转录组测序scRNA-Seq(二)

文章

背景

名词

Barcoding

Spike-in

Dropout

Mass cytometry

Split-pooling

Basic step

Types of material

补充：测序平台

推荐阅读更多精彩内容