科研绘图模板之箱线分面图

箱线分面图(Boxplot Faceting)用于展示一个或多个分组变量的统计分布。通过将箱线图按照某个分类变量的不同类别进行分组排列,可以方便地比较不同分组中数据的分布情况。这种图表结合了箱线图和分面(Faceting)的概念,使得数据的多维对比更为直观和有效。

箱线图(Boxplot)组成部分:

  1. 中位数:数据集中的中位数,箱线图中的一条线表示。
  2. 四分位数:数据集被分为四等份,第一四分位数(Q1)和第三四分位数(Q3)形成箱体的底部和顶部。
  3. 箱体(IQR,四分位距):表示数据的中间50%,即Q1到Q3的距离。
  4. 须(Whisker):从箱体向外延伸,通常延伸至最小值和最大值或1.5倍的四分位距外的异常值边界。
  5. 异常值:通常用小点表示,这些是超出须端的数据点。

分面(Faceting):

  • 分面是一种将数据集拆分成多个小图(分面),按照一个或多个分类变量进行组织的技术。
  • 每个分面都是一个箱线图,展示该分类下的数据分布。
  • 分面可以是垂直或水平的,也可以是网格形式的,这取决于要展示的分类变量的数量和类型。

示例

# 加载所需库
library(ggplot2)
library(dplyr)
library(tidyr)
library(readr)  # 更现代的读取数据函数

# 文件路径
inputFile <- "input.txt"        
outFile <- "boxplot.pdf"        

# 读取输入文件
rt <- read_tsv(inputFile, col_names = TRUE, col_types = cols(.default = col_double()), .name_repair = "minimal")
names(rt)[1] <- "Type"
x <- names(rt)[1]

# 差异分析
# 重新组织数据以便使用dplyr和purrr进行统计测试
rt_long <- pivot_longer(rt, -Type, names_to = "Gene", values_to = "Expression")

# 进行统计测试
rt_long <- rt_long %>%
  group_by(Gene, Type) %>%
  nest() %>%
  mutate(test_result = map(data, ~ {
    if (n_distinct(.x$Type) > 2) {
      kruskal.test(Expression ~ Type, data = .x)
    } else {
      wilcox.test(Expression ~ Type, data = .x)
    }
  })) %>%
  mutate(p_value = map_dbl(test_result, ~ .x$p.value),
         Sig = case_when(
           p_value < 0.001 ~ "***",
           p_value < 0.01  ~ "**",
           p_value < 0.05  ~ "*",
           TRUE            ~ ""
         )) %>%
  ungroup() %>%
  mutate(Gene = paste(Gene, Sig))

# 绘制
p1 <- ggplot(rt_long, aes(x = Type, y = Expression, fill = Type)) +
  geom_boxplot() +
  facet_wrap(~Gene, nrow = 1) +
  labs(x = x, y = "Gene expression") +
  theme_bw() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

# 输出
ggsave(outFile, plot = p1, width = 9, height = 5)


  • ggplot2: 用于创建高级图形。

  • dplyr: 提供了一组工具,用于高效数据操纵和分析。

  • tidyr: 用于数据整理,将数据从宽格式转换为长格式。

  • readr: 提供了更快更友好的数据读取函数。

  • inputFile: 指定输入文件的路径,此处为"text.txt"。

  • outFile: 指定输出文件的路径,此处为"boxplot.pdf"。

  • 使用read_tsvreadr包读取制表符分隔的数据文件。col_names = TRUE表示第一行数据为列名,col_types设置所有列默认为双精度类型,name_repair = "minimal"用于处理列名,保持原始列名不变。

  • 将数据框的第一列重新命名为"Type",这是后续分析中用作分类变量的列。

  • 使用pivot_longer函数将数据从宽格式转换为长格式,方便进行分组和统计测试。

  • 在长格式数据中,每个基因的表达水平现在在"Expression"列,基因名在"Gene"列,样本类型在"Type"列。

  • group_by(Gene, Type): 按基因和类型分组。

  • nest(): 将每个组的数据嵌套在一个列表列中,便于应用统计测试。

  • mutate(test_result = map(data, ~ {...})): 使用map函数应用统计测试。如果类型大于两个,使用Kruskal-Wallis检验;否则,使用Wilcoxon检验。

  • 计算p值,并根据p值添加显著性标记(***, **, *, 空)。

  • ungroup(): 移除分组状态。

  • mutate(Gene = paste(Gene, Sig)): 在基因名后添加显著性标记。

  • 使用ggplot2生成箱线图,按"Type"分类,以"Expression"为y值。

  • facet_wrap(~Gene, nrow = 1): 使用facet_wrap分面显示每个基因,每行显示一个分面。

  • theme_bw(): 使用黑白主题。

  • theme(axis.text.x = element_text(angle = 45, hjust = 1)): 调整x轴标签的角度和位置,以提高可读性。

  • ggsave: 保存图形为PDF文件,指定文件路径和尺寸。

这段代码整体非常结构化和系统化,适合进行大规模的数据分析和可视化,特别是在生物信息学或医学研究中分析基因表达数据。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 229,836评论 6 540
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 99,275评论 3 428
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 177,904评论 0 383
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 63,633评论 1 317
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 72,368评论 6 410
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 55,736评论 1 328
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 43,740评论 3 446
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 42,919评论 0 289
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 49,481评论 1 335
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 41,235评论 3 358
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 43,427评论 1 374
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 38,968评论 5 363
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 44,656评论 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 35,055评论 0 28
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 36,348评论 1 294
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 52,160评论 3 398
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 48,380评论 2 379

推荐阅读更多精彩内容