单细胞数据挖掘实战:文献复现(三)降维、聚类和细胞注释

单细胞数据挖掘实战:文献复现(一)批量读取数据

单细胞数据挖掘实战:文献复现(二)批量创建Seurat对象及质控

前面得到了samples_objects Seurat对象并进行了质控,下面进行降维、聚类和细胞注释,主要是复现一下文献中的Fig. 1b和Fig. 1c

一、高变基因

samples_objects <- lapply(seq_along(samples_objects), function(i) {
  samples_objects[[i]] <- FindVariableFeatures(object = samples_objects[[i]],
                                               selection.method = "vst", 
                                               nfeatures = 2000, verbose = FALSE)
})
names(samples_objects) <- names(samples_raw_data)

二、在Seurat对象中添加一些相关信息

  • 文献中Fig. 1b和Fig. 1c主要用f_ctrl_1, f_tumor_1, m_ctrl_1, m_tumor_1这四个样本;
  • 添加相关基因:用来计算细胞周期评分
#细胞周期相关基因
s_genes <- cc.genes$s.genes
g2m_genes <- cc.genes$g2m.genes
#小胶质细胞和巨噬细胞标志物
microglia_markers <- c("Tmem119", "P2ry12", "Sall1", "Pros1", "Crybb1")
macrophages_markers <- c("Itga4", "Tgfbi", "Cxcl2", "Ccr2", "Il10", "Fgr")
samples_objects <- lapply(seq_along(samples_objects), function(i) {
  # 添加shortID
  samples_objects[[i]]$shortID <- substr(as.character(samples_objects[[i]]$orig.ident), 15,
                                         nchar(as.character(samples_objects[[i]]$orig.ident)))
  
  # 添加sex和sex_condition
  samples_objects[[i]]$sex <- substr(as.character(samples_objects[[i]]$shortID), 12, 12)
  samples_objects[[i]]$sex_condition <- paste0(samples_objects[[i]]$sex, "_", samples_objects[[i]]$condition)
  
  # 添加var.features
  samples_objects[[i]]@assays$RNA@var.features <- unique(c(samples_objects[[i]]@assays$RNA@var.features, 
                                                           s_genes, g2m_genes, microglia_markers, macrophages_markers))
  samples_objects[[i]]
})
names(samples_objects) <- names(samples_raw_data)

三、按条件整合样本、PCA, t-SNE 及找细胞类群

设置参数

anchor_dims <- 30
pca_dims <- 30
clustering_resolution <- 0.3
n_features <- 2000

下面这个过程耗时较长

sex_condition_objects <- lapply(c(1,3,5,7), function(i) { # f_ctrl_1, f_tumor_1, m_ctrl_1, m_tumor_1
  sex_condition <- unique(samples_objects[[i]]$sex_condition)
  #按条件整合样本(f_ctrl_1, f_tumor_1, m_ctrl_1, m_tumor_1)
  print(paste0("Find Integration Anchors: ", sex_condition))
  samples_anchors <- FindIntegrationAnchors(object.list = list(samples_objects[[i]], 
                                                               samples_objects[[i + 1]]), 
                                            dims = 1:anchor_dims,
                                            anchor.features = n_features)
  print(paste0("Integrate Data: ", sex_condition))
  samples_integrated <- IntegrateData(anchorset = samples_anchors, dims = 1:anchor_dims)
  DefaultAssay(object=samples_integrated) <- "integrated"
  #细胞周期评分(CellCycleScoring函数)
  print(paste0("Cell Cycle Scoring:", sex_condition))
  samples_integrated <- CellCycleScoring(object = samples_integrated, s.features = s_genes,g2m.features = g2m_genes, set.ident = TRUE)  
  
  print(paste0("Scale Data: ", sex_condition, " regress out: nCount_RNA, percent_mito, CC_difference"))
  
  #计算 G2M 和 S 期分数之间的差异,以分离非周期细胞和周期细胞
  # Seurat细胞周期评分和回归 
  samples_integrated$CC_Difference <- samples_integrated$S.Score - samples_integrated$G2M.Score
  samples_integrated <- ScaleData(object = samples_integrated, verbose = FALSE, 
                                  vars.to.regress = c("nCount_RNA", 
                                                      "percent_mito", 
                                                      "CC_Difference"))  
  
  print(paste0("Run PCA: ", sex_condition))
  samples_integrated <- RunPCA(object = samples_integrated, npcs = pca_dims, verbose = FALSE)
  
  print(paste0("Run t-SNE:", sex_condition))
  samples_integrated <- RunTSNE(object = samples_integrated, reduction = "pca", dims=1:pca_dims)
  
  print(paste0("Find Neighbors: ", sex_condition))
  samples_integrated <- FindNeighbors(object = samples_integrated, dims = 1:pca_dims)
  
  print(paste0("Find Clusters: ", sex_condition))
  samples_integrated <- FindClusters(object = samples_integrated, resolution = clustering_resolution) 
  samples_integrated
})
names(sex_condition_objects) <- substring(names(samples_objects), 1, nchar(names(samples_objects))-2)[c(1,3,5,7)]

保存

saveRDS(sex_condition_objects, file = "sex_condition_objects.RDS")

四、细胞注释

  • 细胞注释这一步文献中是手工注释的,需要找一些marker,然后根据marker基因在哪些cluster中表达来判断;
  • 可以用DotPlot和FeaturePlot可视化marker基因;
  • 文献中用到的marker在附件中,可以下载

先看一下文献中的图


1.png

这里只尝试f-ctrl这个样本,其它三个大家可以自己去复现一下
先简单画个图,看下cluster

DimPlot(sex_condition_objects[[1]],label = T)
2.png

选取marker并作图观察

##这些marker来自文献中Fig. 1c中所示的基因
ctrl_gene_panel <- c("Cd14", "Tmem119", "P2ry12", "Csf1", "Crybb1", "Mcm5", "Ifit3", "Tgfbi", "Ifitm2", "Ifitm3", "S100a6", "Ly6c2", "Ccr2", "Mrc1", "Cd163", "Cd24a","Ncam1")

########################FeaturePlot###########
for (i in seq_along(ctrl_gene_panel)) {
  FeaturePlot(sex_condition_objects[[1]], features = ctrl_gene_panel[i], coord.fixed = T, order = T)
  ggsave2(paste0("FeaturePlot_tumor_gene_panel_", tumor_gene_panel[i], ".png"), path = "./annotation/f_ctrl", width = 10, height = 10, units = "cm")
}
#######################
#############################DotPlot#####################
p <- DotPlot(sex_condition_objects[[1]], features = ctrl_gene_panel,
             assay='RNA'  )  + coord_flip()
p
###############################################
3.png

需要对这些marker进行观察判断,然后根据marker对细胞进行注释,这里就按照文献里的注释进行下一步;

注释:Fig. 1b

#################################################
anno_cells <- c("MG1","MG2","MG3","BAM","MG4","MG5","pre-MG",
                "pre-MG","pre-MG","pre-MG","MG6","pre-MG")
names(anno_cells) <- levels(sex_condition_objects[[1]])
sex_condition_objects[[1]] <- RenameIdents(sex_condition_objects[[1]],anno_cells)
DimPlot(sex_condition_objects[[1]],label = T,pt.size = 0.5,
        cols = c("#9AEAFF","#41589C","#64A7D4","#0FD1AE",
                 "#3A2985","#427DB0","#29A5C8","#518FC3"))+NoLegend()
#################################################

和文献的图比较一下

4.png

总体感觉差不多,MG4位置有点不一样,不知道是不是因为R包版本不一致引起的?

Fig. 1c

DotPlot(sex_condition_objects[[1]], features = ctrl_gene_panel,
        cols = c("#92cee9","#00ed01")) + RotatedAxis() +
        theme(legend.position="top")

和文献的图比较一下


5.png

颜色需要调一下,字体什么的可以去AI里修改,这里只做了f_ctrl_1一个样本,还有f_tumor_1, m_ctrl_1, m_tumor_1三个样本,感兴趣的话可以去试一下。

往期单细胞数据挖掘实战

单细胞数据挖掘实战:文献复现(一)批量读取数据

单细胞数据挖掘实战:文献复现(二)批量创建Seurat对象及质控

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,012评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,628评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,653评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,485评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,574评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,590评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,596评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,340评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,794评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,102评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,276评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,940评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,583评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,201评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,441评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,173评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,136评论 2 352

推荐阅读更多精彩内容