一、分析思路
下载数据-数据状态(是否要标准化,是否有无效数据)-探针名与基因名的对照转换-重复信号、缺失信号的处理-组间差异分析-成图(热图、火山)
二、工具
R、GEOquery、
三、注释名称转换
参考了各种大佬
library(AnnotationDbi)
library(org.Hs.eg.db)
geneexp <- genes_expr
geneids<-as.character(row.names(geneexp))
###从GENE_ID转成SYMBOL, columns 转换成什么 keytype 原始是什么
annoutu13<-select(org.Hs.eg.db,keys = geneids,columns ="SYMBOL",keytype = "ENTREZID")
gzsindex<-match(geneids,annoutu13$ENTREZID)
genesymbols<-annoutu13$SYMBOL[gzsindex]
quNAindex<-which(is.na(genesymbols))
geneexp_nna <- geneexp[-quNAindex,]
genesymbols_nna <- genesymbols[-quNAindex]
table(duplicated(genesymbols_nna))
row.names(geneexp_nna)<-genesymbols_nna
望各位成功