环境:
版本:
library(TCGAbiolinks)
> projects <- TCGAbiolinks::getGDCprojects()$project_id
> projects <- projects[grepl('^TCGA', projects, perl=TRUE)]
> projects
测试一个下载,发现直接就有按照层次命名好的目录
query <- GDCquery(project = "TCGA-OV",
data.category = "Transcriptome Profiling",
data.type = "Gene Expression Quantification",
workflow.type = "STAR - Counts")#GDC在2022.3.28更新了,workflow.type只能选择STAR - Counts
GDCdownload(query)
只支持star
尝试全部下载到默认位置并使用默认命名
有多种类型数据
命名也很全
临床数据
直接下载的表达数据中就包含临床数据
看重合
表达
临床
做生存分析时的参数选择:
vital_status
OS.time: 当患者dead时,days_to_death为OS.time;当患者alive时,days_to_last_follow_up为OS.time