circos 学习手册(六)

ideogram(一)

介绍

在生物学应用背景下,circos 图通常对应于染色体,组装的 contigs 或者克隆 clones

我们默认将 ideogram 认为是染色体

染色体与 ideogram

理解染色体与 ideogram 之间的区别是很重要的

染色体是核型文件( karyotype 参数指定的文件)中定义的完整的序列结构

ideogram 是染色体或其上的区间在图形上的描述

一条染色体可能

  • 没有 ideogram:没有画出;
  • 有一个 ideogram:画出染色体全部或者部分;
  • 或者多个 ideogram:画出染色体上多个区域。

一条染色体可以切割成任意多的区域,每一个区域显示成一个 ideogram,可以以任意顺序排列

非生物学应用背景

通常情况下,轴可以是任意整数区间形式的变量

只要能够表示成区间形式就行,如 [0,1000]

数据点能够通过对应于相应的区间放置到轴上

圆形图形格式解析

circos 的图像是基于圆轴布局,数据绘制的轨迹分布在圆形布局的内、外部。

数据轨迹包括连接两个染色体位置的连接线,以及像散点图、直方图和热图等标准的数据展示形式

轴线定义、位置、大小和格式是构成 circos 图形的核心

circos 显示的每个数据点都与轴上的一个区间(如,chr5:1000-1500)相关

配置文件中(<ideogram> 块)的很大一部分都是用来确定如何控制 ideograms 的格式

你可以通过设置 show=no 来隐藏 ideograms、刻度以及对应的标签,但是数据还是会显示。

<ideogram>
show = no
...
</ideogram>

主要内容

1、核型(karyotype)定义

核型文件用于定义轴线,在生物学意义上,可以表示染色体、contig 序列和克隆。

每个轴线(如,染色体)都有一个唯一的标识符,标签(在图中显示的每个 ideogram 的文本),大小和颜色

1.1 circos 图形的设计

创建 circos 图像最难的部分在于确定要显示哪些数据

要将数据映射到 circos 图形上,需要确定在数据中哪些模式更重要,以及应该存在哪些模式

1.2 定义染色体

染色体定义的格式

chr - ID LABEL START END COLOR

前两个字段是固定的:

  • chr 代表这行定义了一条染色体,
  • - 定义父级结构,仅被用于条带定义

其他字段

  • ID 数据文件中使用的标识符,
  • LABEL 为将出现在 ideogram 图像旁边的文本

:如果想要绘制多物种,可以在染色体前面加上物种标识符前缀(如,hs=Homo sapiens, mm=Mus musculus),建议都加上前缀,这样做有助于创建更加透明的配置文件和数据文件

  • STARTEND 两个字段定义了染色体的大小

:在核型文件中应该存储整个染色体的大小,而不仅仅是你想要绘制的区间的大小,利用其它文件的配置参数来控制需要绘制的区域

  • COLOR 字段定义了染色体颜色

:默认使用 etc/color.conf 配置文件中定义的染色体配色方案,为每条人类染色体定义颜色并命名为类似于:chr1,chr2,...,chrx,chry,chrun
,且必须为小写

用如下命令在配置文件中指定核型文件

karyotype = data/karyotype/karyotype.human.txt

如人类核型 GRCh37(hg19)24 条染色体

chr - hs1 1 0 249250621 chr1
chr - hs2 2 0 243199373 chr2
chr - hs3 3 0 198022430 chr3
...
chr - hs22 22 0 51304566 chr22
chr - hsX x 0 155270560 chrx
chr - hsY y 0 59373566 chry

以及 862 个条带

band hs1 p36.33 p36.33 0 2300000 gneg
band hs1 p36.32 p36.32 2300000 5400000 gpos25
band hs1 p36.31 p36.31 5400000 7200000 gneg
...
band hsY q11.223 q11.223 22100000 26200000 gpos50
band hsY q11.23 q11.23 26200000 28800000 gneg
band hsY q12 q12 28800000 59373566 gvar
1.3 染色体条带

条带的定义方式与染色体相同,但是前两个字段是 band 和所在染色体的 ID

band hs1 p36.33 p36.33 0 2300000 gneg
band hs1 p36.32 p36.32 2300000 5300000 gpos25
band hs1 p36.31 p36.31 5300000 7100000 gneg
...
band hs2 p25.3 p25.3 0 4300000 gneg
band hs2 p25.2 p25.2 4300000 7000000 gpos50
band hs2 p25.1 p25.1 7000000 12800000 gneg
...

你可以从 UCSC Genome Viewer Table Browser 获取核型结构,但是,并不是所有基因组都有这些数据

例如,小鼠(mm9) 和大鼠 (rn4) 有条带信息,但是狗(canfam2) 或牛(bostau3)没有

1.3.1 条带透明度

染色体本身就有相应的颜色,当条带透明开启了,染色体的颜色就会显示出来

<ideogram>
show_bands = yes
fill_bands = yes
band_transparency = 4
...
</ideogram>

band_transparency 的值可以在 1..auto_alpha_stepsauto_alpha_steps 是每种颜色自动生成的透明度层级的数量(在etc/image.cong中定义了)

band_transparency=1 是最不透明,band_transparency=auto_alpha_steps 表示最透明。对于给定 band_transparency,不透明度为 band_transparency/(auto_alpha_steps+1)

1.3.2 何时使用条带

染色体条带具有两个特殊的属性:

  • 覆盖在整个染色体
  • 相互之间不重叠

如果想要使用条带的特征来显示其他染色体的注释,必须确保数据是细胞遗传学条带模式

# 获取 ideogram 图形的内外半径
r0 = dims(ideogram,radius_inner)
r1 = dims(ideogram,radius_outer)
1.4 定义多物种

如果你想要绘制多物种的 ideogram 图形,可以将它们的核型文件赋值给 karyotype 参数

karyotype = data/karyotype/karyotype.human.txt,data/karyotype/karyotype.rat.txt
# data/karyotype/karyotype.human.txt
chr - hs1 1 0 249250621 chr1
chr - hs2 2 0 243199373 chr2
chr - hs3 3 0 198022430 chr3
...

# data/karyotype/karyotype.rat.txt
chr - rn1 1 0 267910886 chr1
chr - rn2 2 0 258207540 chr2
chr - rn3 3 0 171063335 chr3
1.5 非基因组核型文件

circos 旨在绘制基因组数据,但并不局限于此。

如果你有任何可以转换为圆形组合的位置数据,则可以定义抽象的“染色体”作为数据域

chr - axis1 1 0 1000 green
chr - axis2 2 0 1000 red
band axis1 band1 band1 0 99 grey
band axis1 band2 band2 100 199 white
band axis1 band1 band1 200 299 grey
band axis1 band2 band2 300 399 white
...

(未完待续...)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,744评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,505评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,105评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,242评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,269评论 6 389
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,215评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,096评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,939评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,354评论 1 311
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,573评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,745评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,448评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,048评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,683评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,838评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,776评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,652评论 2 354

推荐阅读更多精彩内容