circos 学习手册(五)

数据文件

circos 的输入文件是纯文本数据文件

像染色体定义、数据(<plot>),关系(<link>),强调(<highlight>)都需要外部文件作为输入内容

根据展示数据信息的不同,不同格式的输入文件会有少许不同

1 文件格式

1.1 KARYOTYPE —— 生物学应用

karyotype 文件用于定义染色体,默认会绘制所有染色体

每条染色体都会有名字、标签、起始和终止位置以及颜色

例如,人类的 karyotype 文件,像这样

# 
chr - hs1 1 0 249250621 chr1
chr - hs2 2 0 243199373 chr2
chr - hs3 3 0 198022430 chr3
...

circos 在染色体名字前面使用特殊的前缀,而不是常用的 chr 前缀

而染色体颜色还是用 chr 作为前缀,为啥?因为颜色是不需要区分物种的

karyotype 文件可以选择性的为染色体定义染色体遗传条带

band hs1 p36.33 p36.33 0 2300000 gneg
band hs1 p36.32 p36.32 2300000 5400000 gpos25
band hs1 p36.31 p36.31 5400000 7200000 gneg
...

你可以在 data/karyotype 文件夹下找到常用的参考基因组的 karyotype 文件

(base) ➜ ls circos-0.69-9/data/karyotype
README                              karyotype.human.hg18.txt
assembly                            karyotype.human.hg19.txt
chromosome.band.hg19.txt            karyotype.human.hg38.txt
chromosome.band.hg38.txt            karyotype.human.txt
dm6.hires.txt                       karyotype.mouse.mm10.txt
dm6.lowres.txt                      karyotype.mouse.mm9.txt
karyotype.arabidopsis.tair10.txt    karyotype.mouse.txt
karyotype.arabidopsis.txt           karyotype.oryzasativa.txt
karyotype.chimp.pt4.txt             karyotype.rat.rn4.txt
karyotype.chimp.txt                 karyotype.rat.txt
karyotype.drosophila.dm6.hires.txt  karyotype.rm.3.txt
karyotype.drosophila.dm6.lowres.txt karyotype.rm.txt
karyotype.drosophila.hires.dm3.txt  karyotype.sorghum.txt
karyotype.drosophila.lowres.dm3.txt karyotype.yeast.txt
karyotype.drosophila.txt            karyotype.zeamays.txt
karyotype.human.hg16.txt            parse.karyotype
karyotype.human.hg17.txt

1.2 KARYOTYPE —— 一般应用

如果你的数据不是基于染色体的,可以在 karyotype 文件中定义你需要展示数据的任意轴线

例如,定义 3 个大小分别为 100020003000 的片段,并命名为 axis1axis2axis3

chr - axis1 1 0 1000 black
chr - axis2 1 0 1500 blue
chr - axis3 1 0 2000 green

1.3 线、散点图、直方图和热图

线、散点图、直方图和热图都是 2D 数据,都是与基因组位置相关的值

#chr start end value [options]
hs5 50 75 0.75

1.4 tile

tile 定义为同一染色体上的区间,用来显示覆盖率相关信息,如 readsclones 等信息

#chr start end [options]
hs5 50 75 

1.5 text

与基因组位置相关的文本信息,如文本标签

#chr start end label [options]
hs5 50 75 ABC

如果你要显示多个词,可以用 tab 作为分隔符

1.6 links

同一染色体或不同染色体不同区域之间的关系,可以绘制成线条或丝带的形状

# chr1 start1 end1 chr2 start2 end2 [options]
hs1 200 300 hs10 1100 1300
hs7 50 150 hs 5000 6000 color=blue

binlinks, bundlelinksfilterlinks 工具 可以用于操作和分析 link 文件.

2 options 选项

<plot>, <link>,或 <highlight> 块中定义的特定数据点的任何格式化选项,如形状、大小、颜色等,都通过输入文件来定义

在上面展示的例子中的 [options] 字符可以通过以逗号分隔的键值对的字符串来设置

chr start end var1=value1,var2=value2,...

而对于解析为列表值,如 RGB 值,需要用 ()[] 来分隔

chr start end color=(R,G,B)
有无数据值时的 options

输入文件中有与基因组位置相关的值时,options 域在第 5

chr start end value options

如果没有值,options 域在第 4

chr start end options

如果你试图在将有值的文件,作为期望无值的输入文件,将会抛出错误,无法解析 options

Error parsing data point options. Saw parameter assignment [0.75] but expected it to be in the format x=y.

3 文件分隔符

默认情况下是以空白符作为分隔符,想要更改分隔符

可以在配置文件中定义 file_delim 参数

最好是将参数放在 etc/housekeeping.conf 文件中

# etc/housekeeping.conf
file_delim = \t

如果想要设置多词文本标签,需要设置分隔符为 tab,将会应用于所有输入文件(数据文件和核型文件 karyotype

4 文件位置

如果指定特定文件的绝对路径,circos 将不会去其他地方寻找文件

file = /path/to/file.txt

如果文件 /path/to/file.txt 不存在,将会引发错误

如果使用相对路径

file = data/file.txt

circos 将会试图以下面的顺序在多个目录中查找

  • data_path 下的所有目录
  • CWD/
  • CWD/etc
  • CWD/data
  • CWD/../
  • CWD/../etc
  • CWD/../data
  • CWD/../..
  • CWD/../../etc
  • CWD/../../data

CWD 为当前目录,推荐使用相对路径的方式,这样的可移植性较好

建议你将数据文件放置一个单独的文件夹中 (e.g. data/),与配置文件区分开

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,384评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,845评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,148评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,640评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,731评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,712评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,703评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,473评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,915评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,227评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,384评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,063评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,706评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,302评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,531评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,321评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,248评论 2 352

推荐阅读更多精彩内容