spike-in的那些事

日常掰瞎

  第一眼看到spike-in这个词,首先想到了以下两个问题:
  spike-in是什么?
  所谓spike-in就是适用于所有应用的掺入质控品,包含多个不同的 DNA 序列,这些序列并非来自您的目标生物体,但其 GC 含量与您的目标生物体的 GC 含量相同。对于高通量测序平台,掺入spike-in的 DNA 片段的长度也应与文库构建前的 DNA 片段大致相同。例如RNA-seq 分析时,使用的外部 RNA控制混合物 (ERCC) ,做人类细胞H3K79me2的ChIP-seq 分析时掺入的果蝇表观基因组。
  spike-in能干什么?
  通常芯片或NGS测序平台来比较两个或多个实验条件之间变化的分析都基于一个假设,就是要分析的样品(无论是 DNA 还是 RNA)在不同实验条件下每个细胞的总产量是相同的。因此,研究人员通常采用相同数量的总 RNA 或 DNA 在他们的芯片或NGS测序平台上进行分析,并将所得数据相互标准化,以便使来自每个实验条件的信号总量(例如,每百万reads [RPM ] 测序归一化和芯片分位数归一化)保持相同,到达可比较的目的。然而,当来自不同实验条件的细胞不能产生相同数量的 DNA 或 RNA 时,这种假设就是有缺陷的。那么为了准确解释样本间基因组每个区域的信号是否增加或减少,就要在每个样本中掺入一定比例的spike-in做为对照,用于随后的数据标准化。文字解释可能不是那么直观,下面来看一个示意图:

(a) 当基因组各处都发生相同程度的变化时,将总测序reads归一化为相同的数字会隐藏变化,而将spike-in的reads归一化为相同的数字会揭示reads密度的全局变化。
(b) 当特定基因组区域发生信号增加时,标准化样本之间的总测序reads会导致来自基因组其他区域的reads数量人为减少,这就会错误地解释为在特定实验条件下减少。而通过使用spike-in的reads作为标准化,可以避免这种人为的变化。
(c) 甲基化 DNA 拷贝数的差异在使用spike-in标准化下可以被准确的分析,而样本中甲基化的比例在没有spike-in标准化下也可以正确分析。

案例

  下面的图片显示了使用spike-in做为标准化的前后信号对比情况。a、b两个图为基因组的信号track图,显示了由 MNase-seq 得到的年轻和年老细胞中确定的核小体信号分布。a图为没有使用spike-in做为标准化,可以看出年轻和年老细胞中确定的核小体信号分布没有差别,而使用spike-in标准化(b图)后年老细胞中核小体的信号仅为年轻里的一半。c、d(spike-in标准化)显示了年轻和年老细胞中由 RNA-seq 确定的基因表达倍数变化情况。从这里可以看出,spike-in对实验条件之间的全局变化进行归一化的效果很明显。

方法

  在一个简单的场景中,例如,当reads-in计数和样本浓度之间存在线性相关性时,可以基于全局线性标度执行归一化。通过将对照组中spike-in的reads数与实验组中的reads数进行比较,可以为实验组生成标准化函数,例如,实验组标准化 的reads可以通过一个ratio来矫正,即n = 1.5 ×r ,n表示归一化读取数,r是原始读取数。
  在更复杂的情况下,可能需要数十个spike-in 片段和更复杂的归一化算法来纠正测序偏差。例如,spike-in计数和样本浓度之间的相关性可能看起来是非线性的。这时可以对样本之间的单个区域spike-in计数进行分位数归一化,然后使用非线性回归模型来模拟每个样本的归一化函数。标准化的示意图如下:

结束语

  spike-in的应用看起来效果很明显,但目前普及率好像还不是很高。具体到底好不好用,留待以后见证。简单的应用场景使用起来不怎么难,对于复杂的情况我也是迷迷糊糊的。按照惯例下面给出原始参考文献方便感兴趣的同学。今天的分享到此结束~~~

<<The Overlooked Fact: Fundamental Need for Spike-In Control for
Virtually All Genome-Wide Analyses>>

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,968评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,601评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,220评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,416评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,425评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,144评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,432评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,088评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,586评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,028评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,137评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,783评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,343评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,333评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,559评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,595评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,901评论 2 345

推荐阅读更多精彩内容