默认情况下,IGV单独显示 paired-end reads 的每一个reads,因为它们可以更紧凑地排列。按住Ctrl键单击其中一个reads(在MacOS上按住Cmd键单击),可以以相同的颜色成对的突出显示 paired-end reads。颜色是任意的,但对于每一对 paired-end reads而言是相同的。重复点击其中一个reads会清除颜色。或者,从轨迹的弹出菜单中选择“Clear selections”可以清除轨迹中所有比对的突出显示颜色。
当以配对形式查看时,点击一个比对(如果弹出文本行为已设置为悬停,则悬停在其上)将显示该比对及其配对reads的读取详细信息。
分屏视图
可以通过在 paired-end reads轨迹上右键单击来动态调用分屏视图。右键单击比对并从弹出菜单中选择“View mate region in split screen”。如果比对没有映射的配对,则此选项将变灰。两个比对将以颜色突出显示,以便更容易在第二个面板中看到配对。
您可以再次选择此选项以获取其他比对并并排查看多个面板。有关如何控制视图的多个区域的详细信息,请参见有关查看多个区域的部分。
检测结构变异
paired-end reads测序可以提供插入、重复、易位和倒置等结构变异的证据。IGV可以检测到与paired-end reads比对中发现的异常,这可能表征潜在的结构变异。特别是,一对比对的两个比对读取之间的预期距离以及它们的相对方向是已知的。当实际值与预期值不同时,使用颜色标识异常。这是比对的默认颜色模式,但可以通过右键弹出菜单选择按许多不同属性对比对进行着色。
如果看到许多以相同方式着色的比对,这可能是结构变异的证据。仅看到少量以不规律模式着色的比对,较不太可能表明存在变异。
1.插入大小
预期(或推断)的插入大小值可以根据加载的文件中找到的大小分布即时计算(默认),也可以将其指定为以碱基对为单位的特定大小范围。可以在“View > Preferences”的“Alignments”和“RNA”选项卡中更改默认插入大小选项。要更改一个轨迹的选项,请从轨迹的右键弹出菜单中选择“Set insert size options”。
插入大小的颜色方案是:
大于预期插入大小:两个读取都为红色插入大小可用于检测缺失、插入和染色体间重排。
2. 缺失
在缺失中,与参考基因组相比,当前基因组中缺少一段DNA。
当paired-end reads的一个跨越缺失的DNA段与参考基因组比对时,推断的插入大小将大于预期值。这是由于当前基因组中不存在的基因组缺失部分。可以用下面的示例图示化这一点,其中深蓝色箭头对表示一对配对读取。
当推断的插入大小大于预期时,该对读取的两个读取都会以红色着色,如下例所示,其中显示了缺失两端的分屏视图。
3.插入
在插入的情况下,主体基因组中存在一段在参考基因组中未表示的DNA。
与缺失的情况相比,配对读取之间的距离的效果相反;推断的插入大小小于预期。
当推断的插入大小小于预期时,该对读取的两个读取都会以蓝色着色。
插入大小异常检测能够检测的插入的最大大小受测序片段的大小限制。它们必须足够长,以跨越插入并包括两端映射到参考的序列。因此,第三代长读取测序能够检测比短片段配对末端测序更长的插入。
4. 染色体内融合
在染色体内融合的情况下,主体基因组上的一条染色体上的DNA段与另一条染色体上的DNA段融合。下面的图解以染色体1和染色体6为例。
当从主体基因组的跨越融合的DNA片段的测序对与参考基因组比对时,每个读取都将映射到不同的染色体。
在这种情况下,每个读取都将按其配对的染色体进行着色(请参见上述颜色方案)。
下面的示例显示了两个比对轨迹的分屏视图,一个是肿瘤样本,另一个是匹配的正常样本。左面板显示了染色体1的一个区域,右面板显示了染色体6的一个区域。在肿瘤样本轨迹中,染色体1上的大量读取都着色为棕色(染色体6的颜色),因为它们的配对比对到了染色体6。类似地,它们在染色体6上的配对也被着色为蓝色(染色体1的颜色)。请注意,正常样本中的读取是灰色的,这意味着这种重排仅在肿瘤中发现。
5. 配对方向
paired-end reads的方向可用于检测同一染色体上的倒置、重复和易位。
方向是以读取链为基础定义的:左链与右链,以及一对中的第一个读取与第二个读取。
(图由Bob Handsaker提供)
以下部分的示意图假定采用Illumina paired-end reads测序约定。
6. 倒置
倒置是指与参考基因组相比,在当前基因组中反转的大片段DNA。
当倒置出现在paired-end reads中时,这些reads与参考基因组明显不同。
在IGV中,它显示如下。
7.倒置重复
当一段大片段的DNA被复制并以与原始序列相反的配置插入到基因组中时,这被称为倒置重复。
将会有重叠的左链和右链,还可能会有改变的覆盖深度/拷贝数。
这在IGV中显示如下。
8.串联重复
当一段大片段的DNA被复制并插入到基因组中,并且插入位置靠近原始序列位置时,这被称为串联重复。
这些reads不仅会被复制,而且会被排列如下。
IGV将显示此重新排列,如下所示。
同一染色体上的易位
当从一处删除DNA的大片段并插入到另一处时,这被称为易位。
可以通过颜色编码来检测同一染色体上的易位方向,而在两个染色体之间的易位则可以通过按插入大小着色来检测。