公众号:尤而小屋
作者:Peter
编辑:Peter
大家好,我是Peter~
本文介绍的是如何使用 seaborn 的 boxplot 方法来绘制箱型图,先看看部分图形的绘制效果:
[图片上传失败...(image-ce2350-1649776295600)]
参数
绘制图形中的主要参数如下:
[图片上传失败...(image-dea971-1649776295601)]
更多资料可参考官网地址:https://seaborn.pydata.org/generated/seaborn.boxplot.html
箱型图
箱型图是一种用作显示一组数据分散情况资料的统计图,它能够快速显示数据中的异常值情况,其形状像盒子,因而得名,也称之为盒须图、盒式图、盒装图或者箱型图。
1977年,美国著名数学家John W. Tukey首先在他的著作《Exploratory Data Analysis》中介绍了箱形图。
[图片上传失败...(image-efaead-1649776295601)]
四分位数是箱型图中最为重要的概念。Q3和Q1的差距称为四分位距(InterQuartile Range, IQR):IQR=Q3-Q1
[图片上传失败...(image-7d8fdc-1649776295601)]
内置数据
Seaborn也有自己内置的数据集:
import seaborn as sns
# style设置
sns.set_theme(style="whitegrid")
tips
消费数据集tips
[图片上传失败...(image-2d5045-1649776295601)]
iris
知名的鸢尾花数据集
[图片上传失败...(image-5d37c-1649776295601)]
水平箱型图
In [4]:
# 方式1:指定x为某个Series型数据
ax = sns.boxplot(x=tips["total_bill"])
# 方式2:传入x和data参数
ax = sns.boxplot(x="total_bill",
data=tips)
[图片上传失败...(image-b49157-1649776295601)]
垂直箱型图
In [6]:
ax = sns.boxplot(y=tips["total_bill"])
# 方式2:传入y和data参数
# ax = sns.boxplot(y="total_bill", data=tips)
[图片上传失败...(image-4b6be9-1649776295601)]
参数orient
In [7]:
ax = sns.boxplot(x="day",y="total_bill", data=tips)
[图片上传失败...(image-abcb54-1649776295601)]
改变x-y的位置:
ax = sns.boxplot(y="day",x="total_bill", data=tips)
[图片上传失败...(image-5d1161-1649776295601)]
参数order
对指定的参数进行排序
In [11]:
# 默认情况
ax = sns.boxplot(
x="sex",
y="tip",
data=tips
)
[图片上传失败...(image-7286f1-1649776295601)]
下面的例子中我们引入了参数order,主要是查看x轴中两个标签;
In [12]:
ax = sns.boxplot(
x="sex",
y="tip",
data=tips,
order=["Female","Male"] # 引入参数
)
和默认情况下的排序不同,按照指定的顺序进行展示:
[图片上传失败...(image-8447a3-1649776295601)]
参数hue使用
参数hue主要是用来进行色条的调节
In [13]:
ax = sns.boxplot(
x="day",
y="tip",
data=tips,
hue="sex" # 引入参数
)
[图片上传失败...(image-361e01-1649776295601)]
参数hue_order
In [14]:
ax = sns.boxplot(
x="day",
y="tip",
data=tips,
hue="sex",
hue_order=["Female","Male"] # 引入参数
)
[图片上传失败...(image-8b614a-1649776295601)]
参数palette
颜色版的设置使用palette
In [15]:
ax = sns.boxplot(
x="day",
y="tip",
data=tips,
hue="sex",
palette="Set3" # 颜色版
)
[图片上传失败...(image-f3b7be-1649776295601)]
ax = sns.boxplot(
x="day",
y="tip",
data=tips,
hue="sex",
palette="Set2" # 颜色版
)
[图片上传失败...(image-fb070b-1649776295601)]
[图片上传失败...(image-f58187-1649776295601)]
[图片上传失败...(image-10da2e-1649776295601)]
大小参数
主要是saturation、width、fliersize、linewidth、whis的设置
In [19]:
# 全部是默认情况
ax = sns.boxplot(x="sex",y="tip", data=tips, hue="day")
[图片上传失败...(image-8dd956-1649776295601)]
ax = sns.boxplot(
x="sex",
y="tip",
data=tips,
hue="day",
width=0.7,
linewidth=3,
)
[图片上传失败...(image-3d33a7-1649776295601)]
ax = sns.boxplot(
x="sex",
y="tip",
data=tips,
hue="day",
width=0.7,
linewidth=3,
whis=3 # 引入whis
)
[图片上传失败...(image-64cbb-1649776295601)]
参数notch
自定义缺口
In [22]:
ax = sns.boxplot(
x="day",
y="total_bill",
hue="sex",
data=tips,
notch=True # 加入参数
)
[图片上传失败...(image-e768b1-1649776295601)]
参数dodge
必须和hue一起使用,控制同一个分组下面的箱型图是分开绘制还是重叠在一起
In [23]:
ax = sns.boxplot(
x="day",
y="total_bill",
hue="sex",
data=tips,
dodge=False)
[图片上传失败...(image-43fe91-1649776295601)]
ax = sns.boxplot(
x="day",
y="total_bill",
hue="sex",
data=tips,
dodge=True)
[图片上传失败...(image-a07b12-1649776295601)]
catplot-分类图
箱型图和分类图的结合使用
In [26]:
ax = sns.catplot(
x="sex",
y="total_bill",
hue="smoker",
col="time",
data=tips,
kind="box", # 箱型图
height=4,
aspect=.7)
[图片上传失败...(image-8b17b2-1649776295601)]
ax = sns.catplot(
x="total_bill",
y="sex",
hue="smoker",
col="time",
data=tips,
orient="h", # 水平方向
kind="box", # 箱型图
height=4,
aspect=.7,
palette="Set2"
)
[图片上传失败...(image-407a70-1649776295601)]
ax = sns.catplot(
x="sex",
y="total_bill",
hue="smoker",
col="time",
data=tips,
kind="violin", # 小提琴图
height=4,
aspect=.7)
[图片上传失败...(image-d895c4-1649776295601)]