数据下载专题 | UCSC
- UCSC Xena是由加州大学圣克鲁兹分校(University Of Cingifornia Sisha Cruz,UCSC)维护的数据库,前身是癌症基因组浏览器Cancer Browser ,Cancer Browser目前已经不再更新.
UCSC 官方网址:UCSC Xena
Xena收录了TCGA、GDC、ICGC、TARGET等多个数据库的公共数据,主页如下:
红框1- Analysis 列出了Xena支持的数据分析功能
数据下载
方法一
红框2- 点击Launch Xene 即可进入数据下载界面
箭头指向的是右边所有勾选的data hub中的存储的数据,有122组,1534个数据集,可通过勾选自由选择想要查看的数据平台的数据。以 COAD 为例:
包含:copy number (gene-level)、copy number segments、DNA methylation、exon expression RNAseq、gene expression array、gene expression RNAseq等多个层面的数据,
比如 gene expression RNAseq,下面对应四种数据集,区别在于使用的实验平台或是对数据的处理方法,具体介绍可点击方框里的链接查看
进去 IlluminaHiSeq, 界面如下:
绿色方框 对应着.json的格式文件,可以自行打开查看
蓝色方框 对应着下载的数据的 基因名 和 样本名 ,如下
黄色方框 的链接,进入 NCI(National Cancer Institue) ,which is part of the National Institutes of Health(NIH).
下载的数据形式
1、从上图链接下载对应的gene mapping数据打开如下:
2、COAD 的gene expression下载完成后,打开如下:
其他
帮助文档中给出了其他的下载方法数据下载
数据的可视化分析
"VISUALIZATION" 对应着UCSC Xena 的可视化分析,
可以发现通过移动鼠标,可以观察每个样本和对应探针的属性,按住鼠标拖动(横或竖),可以进行缩放。点击clear zoom 取消全部缩放, zoom out 撤回上一步缩放。当鼠标放在图片上,可以发现右下角有个三角,可以拖动进行放大。
MGMT介绍: 化疗是治疗癌症的重要步骤之一,肿瘤对化疗的耐受是影响化疗结果的重要因素之一。DNA修复酶--O6-甲基鸟嘌呤DNA甲基转移酶(O6-methylguanine-DNA methytransferase,MGMT)在胶质瘤组织中的表达与肿瘤的耐药性相关,且MGMT基因启动子的甲基化状态是决定MGMT表达量的主要因素,并可能影响病人的化疗效果及其预后。
当我们自己想对某一数据集进行可视化分析:https://xenabrowser.net/heatmap/
注 当我们添加数据时至少添加两列才可以进行分析,因为Xena的设计,需要有超过2种数据类型才能找到变化趋势。
添加自己的 data 到 Xena
如果以后需要将自己的数据添加到Xena中进行分析,可通过Xena提供的帮助文档,进行操作
https://ucsc-xena.gitbook.io/project/local-xena-hub/getting-started
学习视频
Xena 中提供了视频教学:https://ucsc-xena.gitbook.io/project/tutorials