看的第二遍了 第一遍看的忘记了 所以整理一下 以防又忘
虽然套路很老 图也没R做的好 但借鉴的地方还是很多
IF 3分左右
PMID: 28901457 PMCID: PMC5780015 DOI: 10.3892/or.2017.5946
在肝癌中的生信分析-确定关键基因
GEO上下载基因,然后对基因进行筛选,筛选差异基因,然后做PPI网络,蛋白互作网络可视化,上下调基因标注,差异基因功能富集,关键基因富集,生存分析看是否有关系。
GEO数据下载和筛选差异基因
GEO网站 GSEXXX
比较时注意 cancer在下 Nomal在上
按住Ctrl选择 Shifit连续选 比较 SAVE ALL
保存TXT 复制到EXCEL
然后筛选差异基因 条件logFC(fold change)的绝对值≥1 , adj.p-value<0.01
对多个芯片取交集差异基因(Venn图)
对筛选好的基因做Venn图
保存EXCEL和TXT数据
做PPI及上下调基因标注Cytoscape
蛋白互作网路 百度STRING
PPI互作网络,将所筛选的全部差异基因输入,然后download TSV格式文件,EXCEL或Cytoscape打开,Cytoscape。按File+Import+Network+File.
Style美化
上下调基因筛选
在之前EXCEL文件中对基因列和logFC列进行上下调标注,VLOOK函数应用,上调UP,下调DOWN,logFC≥1 up,logFC≤-1 down。然后复制到TXT文档中,导入Cytoscape,File+Import+table+File。File collar ,按group分组,选择颜色形状。
显著Module和关键基因筛选
上下调基因筛选完成之后,APP+Manger+install MCODE 然后analysis,得出关键基因
记下筛选参数
显著Module
每个seed download
差异基因和最显著Module的GO及KEGG富集分析
打开DAVID网站 Functional Annotation,导入差异基因,选择OFFICIAL-GENE-SYMBOL,GENE LIST-SUBMIT LIST.
FDR值 矫正后p值
关键基因相互作用网络及功能分析
将之前SED保存的关键基因到EXCEL中,复制到cbioportal中做NETWORK。
黑色为关键基因,其余为共表达基因。
功能分析
Cytoscape,APPS+BINGO然后导入关键基因,选择GO种类,物种,start BINGO
热图
使用在线网站UCSC,选择癌症类型,Genomic,Gene Expression
然后选择亚型 Grade Symple type,最后拼接一起
hub gene生存分析
也是使用在线网站cbioportal,选择TCGA数据,然后survival
关键基因 OncomineMeta分析
Search 关键基因,选择cancer type,选择研究对象勾上,compare比较,记录p值和fold change,然后拼接
关键基因 Oncomine分析
选择关键基因 cancer typ 分级