系统学习单细胞转录组测序scRNA-Seq(二)

刘小泽写于19.3.16
看了一篇综述,又加了一些扩展知识

文章

这是一篇2017发表在Genome Medicine上的文章A practical guide to single-cell RNA-sequencing for biomedical research and clinical applications

背景

  • 单细胞测序:《Nature Methods》2013年度技术;《Nature》2017年7月刊的封面推荐 ;《Science》2018十大科学突破榜首
  • 研究细胞的方法:基因组DNA序列(碱基如何排列、各个序列的丰度)、染色质结构(常听说的3C、4C、5C、HiC等)、mRNA序列(排列与丰度)、非编码RNA、蛋白表达、蛋白修饰、细胞代谢【因此不只有scRNA,还有sc基因组、sc表观组】
  • 一个细胞中的待研究分子是微量的,因此我们一般使用几千细胞或直接取组织(上千万甚至上亿),这样就可以积累足够的分子信息,可以开展 Genome-wide association studies (GWASs) 、鉴定SNPs
  • 主要做什么:分离新细胞亚群、构建细胞间互作网络、体内与体外实验反应、细胞在不同器官的情况、不同人群比较、不同物种比较
  • 总体≠个体:细胞异质性的存在(受精卵发育成个体,最终去向十分多样=》肌肉细胞、神经细胞等等,why?;肿块中心、周围、转移中的细胞各异,分离出来判断疗法有效性)
  • 挑战:同时检查单个细胞中表达的数千种蛋白质(蛋白组研究范畴),这个完整性有待提高

名词

Barcoding

  • 之前做单细胞,真的是一个个细胞取出来,然后独立构建文库测序(比如:流式细胞术、激光捕获显微切割LCM=》组织切片),但是这通量非常低(有点Sanger测序和二代测序对比的感觉)。
  • 后来发展出高通量的方法,主要是给每个细胞加上独一无二的DNA序列(就是条形码barcode,就是为了识别),然后测序时将相同的barcode序列归为同一个细胞来源
  • 单细胞转录组可以在polyT引物5'端加上barcode;单细胞基因组目前主要利用高效转座酶(transposase)Tn5实现

Spike-in

  • Spike-ins can be used for assessing the level of technical variability and for identifying genes with a high degree of biological variability

  • 每个细胞都是独特的,和普通的Bulk RNA-seq不同,材料不容易获得,不太好做重复,因此通过生物学重复来评价技术手段/数据质量的方法不靠谱。

  • 但是数据质量还是需要评价的,那么就通过向每个细胞裂解液中加入已知序列与一定数量的合成mRNA,例如 external RNA control consortium (ERCC)【翻译的话,姑且翻译成:外源RNA对照联盟】开发的“内参”,可以根据RNA读数判断样本间差异

  • 高ERCC含量与低质量数据相关

  • 但是使用spike-in也有一些问题要注意:

    • has to carefully calibrate the concentration that results in an optimal fraction of reads from the spike-ins
    • spike-in mixes are sensitive to degradation
    • captured less efficiently than endogenous transcripts
    • Spike-in不适用于droplet-seq的方法
  • UMI( Unique molecular identifier )

    • barcoding的变体,待扩增的RNA分子用随机n-mer寡核苷酸标记。设计不同标签的数量,大大超过待扩增的转录本,产生独特标记的分子,并允许控制扩增偏差【例如10-mer的UMI,就会有 4的十次方 约等于100万种变化】
    • UMI是一段随机序列,每一个DNA分子都有自己的UMI序列。可以大大降低PCR误差(比如:原来两个样本中某基因表达量相同,但是由于两个样本扩增效率不同,样本1为99%,样本2只有95%,那么同时扩增40个循环,这同一个基因就有了0.99^40 / 0.95^40 = 5.2倍差异,因此本来没有差异也会因为外界因素扩增效率的影响而产生“假阳性”)
    • UMI只用在3'转录本测序的方法中,如CEL-seq2, Drop-seq, MARS-seq

Dropout

  • 基因在一个细胞中有表达,但在另一个细胞中未检测到(按照道理,每个基因应该都可以检测到,只是表达量多少)
  • 可能源于RNA总量少导致扩增建库丢失 或者 RNA表达随机性

Mass cytometry

  • 基于流式细胞法和质谱,其中使用元素标签标记的抗体检测蛋白质表达 - 允许在一次实验中对数千个单细胞上的数十种蛋白质进行平行测定

Split-pooling

Basic step

  • The first, and most important, step in conducting scRNA-seq has been the effective isolation of viable, single cells from the tissue of interest
  • Next, isolated individual cells are lysed to allow capture of as many RNA molecules as possible.
  • Next, poly[T]-primed mRNA is converted to complementary DNA (cDNA) by a reverse transcriptase.
  • Then, amplified and tagged cDNAfrom every cell is pooled and sequenced by NGS.

Types of material

  • 理论上,任何真核生物细胞都可以
  • Primary cells
    • 胚胎 embryo
    • 肿瘤 tumours
    • 神经 nervous system
    • 造血 haematopoietically derived cells
  • The Human Cell Atlas
    • 2017年启动,“媲美人类基因组计划”,核心技术=》单细胞组学
    • 对人类37万亿个细胞进行细胞采集、分类和绘图,侧重描绘组织,而不是整个器官;后期阶段可以纳入器官及感兴趣的疾病小群体
    • 2018.3.8,Sanger研究所宣布人类发育细胞图谱(Human Developmental Cell Atlas ,HDCA)的初步项目25万个发育细胞测序完成

补充:测序平台

  • 10X Genomics
    • 2016.2推出 Chromium
    • 通量高(7分钟内完成100~80,000个细胞的捕获),周期短,成本低,细胞捕获效率高(单个样本细胞捕获率高达65%);细胞活性要求>90% =》 适用于发现新细胞
    • 横向孔道逐个导入凝胶微珠Gel beads =》 第一个纵向道输入细胞 =》Gel吸附细胞=》微流控技术送到第二个纵向通道(“油tube”)=》油滴GEMs 【因此,一个油滴就是一个Gel bead,也就是一个细胞】=》收集到EP管 =》每个Gel bead表明都放满了各不相同的Barcode和UMI序列+polyT =》细胞裂解,polyT抓取mRNA的3'polyA
  • BD Rhapsody
    • 分子标签技术(每个转录本标记特异性分子标签)=》单细胞水平上基因表达谱的绝对定量
    • 单次实验可制备100-10000个单细胞文库
    • CytoSeq特有的蜂窝板技术(20W+的微孔),避免了10X中存在的概率碰撞影响捕获效率问题
    • 可以多样本混合捕获;成像系统;转录组-蛋白组联合分析
  • Wafergen公司 ICELL8
    • 基于微流控芯片,5184个反应孔
    • 每次运行可分离500-1000个细胞
    • 捕获效率为30%,成本相对较低
  • Fluidigm公司C1
    • 通量低、成本高(2000-3000细胞需要18000-100000美元)、周期慢
    • 同时捕获96个细胞
    • 全长转录组
  • llumina Bio-Rad
    • ddSEQ
    • 一次性检测8个样本,每个样本可以得到500~10000个细胞
    • 组织功能、病情进展和治疗反应方面的协同作用
    • 捕获效率低,仅为3%;成本低
  • 1CellBio => InDrop
  • Dolomite => µEncapsulator

欢迎关注我们的公众号~_~  
我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到jieandze1314@gmail.com

Welcome to our bioinfoplanet!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,265评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,078评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,852评论 0 347
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,408评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,445评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,772评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,921评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,688评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,130评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,467评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,617评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,276评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,882评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,740评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,967评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,315评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,486评论 2 348

推荐阅读更多精彩内容