创建新的geom
相对于创建新的"stat", 创建新的"geom"会将难一些,因为这需要你懂得一些grid
知识。因为ggplot2基于grid
,所以你得要学一些用grid
绘图的知识。如果你真的打算学习如何新增一个新的"geom",Hadley推荐你买Paul Murrell所著的R绘图系统。里面介绍所有和用"grid"绘图相关的知识。
一个简单的geom
让我们先从一个简单的案例入手,尝试实现一个类似于geom_point()
的图层
# ggproto原型
GeomSimplePoint <- ggproto("GeomSimplePoint", Geom,
required_aes = c("x","y"),
default_aes = aes(shape = 19, size = 0.1, colour = "black"),
draw_key = draw_key_point,
draw_panel = function(data, panel_params, coord){
coords <- coord$transform(data, panel_params)
grid::pointsGrob(
coords$x, coords$y,
pch = coords$shape,
size = unit(coords$size, "char"),
gp = grid::gpar(col=coords$colour)
)
}
)
# 图层函数
geom_simple_point <- function(mapping = NULL, data = NULL, stat = "identity",
position = "identity", na.rm = FALSE, show.legend = NA,
inherit.aes = TRUE, ...){
layer(geom = GeomSimplePoint, mapping = mapping, data = data, stat = stat,
position = position, show.legend = show.legend, inherit.aes = inherit.aes,
params = list(na.rm = na.rm, ...))
}
ggplot(mpg, aes(displ, hwy)) +
geom_simple_point()
上面的代码和构建新的"stat"非常的相似,我们同样需要为4块内容提供属性/方法
-
required_aes
: 用户所必需的提供的美术属性 -
default_aes
: 默认的美学属性值 -
draw_key
: 提供在图例(legend)绘制关键信息的函数,可用?draw_key
查看帮助文档 -
draw_panel
: 这里就是见证奇迹的地方。该函数接受三个参数作为输入,返回一个grid
的"grob"对象。它在每个面板(panel)运行一次。由于它是最复杂的内容,因此我们有必要详细地介绍它。
draw_panel
有三个参数
-
data
: 数据框,每一列都是一个美学属性 -
panel_params
: 一个列表,里面是coord产生的每个面板的参数。你需要将其当做一个不透明的数据结构: 不要看里面的细节,只要将其传递给coord
方法。 -
coord
: 一个描述坐标系统的对象
你需要共同使用panel_params
和coord
才能对数据进行转换,即coords <- coord$transform(data, panel_params)
。这会创建一个数据框,里面的位置变量会被缩放到0-1之间。得到缩放数据用于调用"grid"的grob函数。(非笛卡尔坐标系统的数据转换比较复杂,你最好是将数据转成已有ggplot2的"geom"所接受的格式,然后传递)。
分组geoms
上一步我们用到的是draw_panel
,也就是为每一行元素创建一个图形元素,比如说上面的GeomSimplePoint
就是每一行一个点,这是最常见的情况。当然,如果你想为每一个分组绘制一个图形元素,那么我们应该使用draw_group()
。
我们用一个简化版的GeomPolygon
为例讲解这个知识点:
GeomSimplePolygon <- ggproto("GeomPolygon", Geom,
required_aes = c("x", "y"),
default_aes = aes(
colour = NA, fill = "grey20", size = 0.5,
linetype = 1, alpha = 1
),
draw_key = draw_key_polygon,
draw_group = function(data, panel_params, coord){
n <- nrow(data)
if (n <= 2) return(grid::nullGrob())
coords <- coord$transform(data, panel_params)
first_row <- coords[1, , drop = FALSE]
grid::polygonGrob(
coords$x, coords$y,
default.units = "native",
gp = grid::gpar(
col = first_row$colour,
fill = scales::alpha(first_row$fill, first_row$alpha),
lwd = first_row$size * .pt,
lty = first_row$linetype
)
)
}
)
geom_simple_polygon <- function(mapping = NULL, data = NULL, stat = "chull",
position = "identity", na.rm = FALSE,
show.legend = NA, inherit.aes = TRUE, ...){
layer(
geom = GeomSimplePolygon, mapping = mapping, data = data, stat = stat,
position = position, show.legend = show.legend, inherit.aes = inherit.aes,
params = list(na.rm = na.rm, ...)
)
}
ggplot(mpg, aes(displ, hwy)) +
geom_point() +
geom_simple_polygon(aes(colour = class), fill = NA)
这里有几个注意点
- 我们重写了
draw_group()
而不是draw_panel()
, 这是因为我们希望polygon是按照绘制,而不是按行绘制。 - 我们分组数据中不到两行,也就是没有足够的数据点去绘制polygon,因此我们返回了一个
nullGrob()
。你认为认为这是图形上的NULL
: 这是一个grob对象,什么也不画,并且也不占任何空间 - 在单位上,
x
和y
都应该是native
的单位。(默认pointGrob()
的单位就是native
,因此我这里没有做修改)。多边形线的宽度(lwd)取决于点的大小,而ggplot2计算的点大小返回的mm单位结果,因此作者将其和.pt
相乘,将其调整为内部lwd接受的输入。
如果你将我们写的和实际的GeomPolygon
比较,你会发现后者重写了draw_panel()
,这是因为他用了一些小技巧来创建polygonGrob()
从而在一次运行中得到多个polygon。这虽然更加复杂,但是在性能上更优秀。
从已有的Geom中继承
有些时候,你只想对已有的图层做一些小的修改。在这种情况下,除了从Geom
继承以外,你还可以从已有的子类中继承。举个例子,我们可能想要更改GeomPolygon
的默认值,使其更好的在StatChull
中工作:
#GeomPolygonHollow继承自GeomPolygon
GeomPolygonHollow <- ggproto("GeomPolyHollwo", GeomPolygon,
default_aes = aes(colour = "black", fill = NA,
size = 0.5, linetype = 1,
alpha = NA))
# layer的stat来自于创建新的stat定义的StatChull
geom_chull <- function(mapping = NULL, data = NULL,
position = "identity", na.rm = FALSE, show.legend = NA,
inheirt.aes = TRUE, ...){
layer(stat = StatChull, geom = GeomPolygonHollow, data = data, mapping = mapping,
position = position, show.legend = show.legend, inherit.aes = inheirt.aes,
params = list(na.rm = na.rm, ...))
}
ggplot(mpg, aes(displ, hwy)) +
geom_point() +
geom_chull()
尽管最终的geom_chull
不允许你用更改"stat"对应的"geom", 但是在当前的情况下,凸壳最应该用的"geom"应该就是多边形。
练习题
- 比较
GeomPoint
和GeomSimplePoint
- 比较
GeomPolygon
和GeomSimplePolygon
版权声明:本博客所有文章除特别声明外,均采用 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND 4.0) 进行许可。