四、seaborn

本文目录如下:
1 风格设定
1.1 sns.set_style()
1.2 sns.despine()
1.3 不同子图,不同风格
1.4 sns.set_context()
2 调色板
2.1 色块
2.2 对比颜色块
2.3 连续颜色块
2.4 简单应用
2.4.1 sns.color_palette()----箱线图
2.4.2 使用xkcd颜色来命名颜色---线图
2.4.3 sns.dark_palette()---核密度估计图
3 因子变量绘图
3.1 boxplot箱线图
3.2 小提琴图violinplot
3.3 散点图
3.3.1两类散点图
3.3.2 散点图与小提琴图结合
3.3.3 散点图与箱线图图结合
3.4 条形图barplot
3.5 点图pointplot
3.6 countplot计数统计图
4 多层面板分类图
4.1线图
4.2 柱状图
4.3 散点图
4.4 箱线图
5 回归图
5.1 sns.regplot()
5.2 sns.lmplot()
6 分布图
6.1 直方图distplot
6.2 双变量关系图jointplot
6.3 变量关系组图pairplot
7 热度图绘制
8 Facetgrid使用方法
8.1 直方图
8.2 散点图
8.3 对比图
8.4 指定顺序画图
8.5 一些参数1
8.6 一些参数2

加载模块和数据

import pandas as pd
import seaborn as sns
import numpy as np
import matplotlib.pylab as plt
sns.set(style='whitegrid',color_codes=True)
np.random.seed(sum(map(ord,'categorical')))
np.random.seed(sum(map(ord,'regression')))
titanic=pd.read_csv('titanic.csv')
tips = sns.load_dataset('tips')
iris = sns.load_dataset('iris')

1 风格设定

1.1 sns.set_style()

()里可以填写white, dark, whitegrid, darkgrid, ticks

def sinplot():
    x = np.linspace(0,14,100)
    for i in range(1,7):
        # sns.set_style('white')
        # sns.set_style('dark')
        sns.set_style('ticks') # 有尖尖
        # sns.despine()  #去掉上边和右边的边框
        plt.plot(x,np.sin(x+i*.5)*(7-i))
sinplot()
plt.show()

输出:
Figure_1.png

1.2 sns.despine()

def sinplot():
    x = np.linspace(0,14,100)
    for i in range(1,7):
        plt.plot(x,np.sin(x+i*.5)*(7-i))
sinplot()
sns.despine(offset=10) #图离轴的距离
# sns.despine(left=True) #隐藏左边的轴
plt.show()

输出:
Figure_1.png

1.3 不同子图,不同风格

with sns.axes_style()
()可以填white, dark, whitegrid, darkgrid, ticks

def sinplot():
    x = np.linspace(0,14,100)
    for i in range(1,7):
        plt.plot(x,np.sin(x+i*.5)*(7-i))
with sns.axes_style('darkgrid'):
    plt.subplot(211)
    sinplot()
plt.subplot(212)
sns.despine()
sinplot()
plt.show()

输出:
Figure_1.png

1.4 sns.set_context()

()里可以填paper, notebook, talk, poster

def sinplot():
    x = np.linspace(0,14,100)
    for i in range(1,7):
        # sns.set_context('paper')
        # sns.set_context('talk') #线粗字大
        sns.set_context('notebook',font_scale=1.5,rc={'lines.linewidth':4.5}) #font_scale指定字的大小
        plt.plot(x,np.sin(x+i*.5)*(7-i))
sinplot()
plt.show()

输出:
Figure_1.png

2 调色板

color_palette()能传入任何Matplotlib,不写参数则默认颜色,可以填写muted,RdBu,Blues_r,Set1,hls,Paired
set_palette()设置所有图的颜色

2.1 色块

current_palette = sns.color_palette()
sns.palplot(current_palette) #12个色块
sns.palplot(sns.color_palette('hls',8))#8个颜色,色度比较亮
plt.show()

输出:
Figure_1.png
Figure_2.png

2.2 对比颜色块

sns.palplot(sns.color_palette('Paired',8))
plt.show()

输出:
Figure_1.png

2.3 连续颜色块

sns.palplot(sns.color_palette('Blues'))
sns.palplot(sns.color_palette('Greens_r')) #参数里可以输入数字,指定颜色的块数,_r由深到浅
plt.show()

输出:
Figure_1.png
Figure_2-1.png

light_paleete()和dark_palette()调用定制连续调色板

sns.palplot(sns.light_palette('green'))
sns.palplot(sns.dark_palette('purple'))
plt.show()

输出:
Figure_1.png
Figure_2.png

2.4 简单应用

2.4.1 sns.color_palette()----箱线图

sns.set_style('whitegrid') #dark;white;
data = np.random.normal(size=(20,8))+np.arange(8)/2 #正态分布 loc均值,scale标准差,size20行8列数据
sns.boxplot(data=data,palette=sns.color_palette('hls',8))
plt.show()

输出:
Figure_1.png

2.4.2 使用xkcd颜色来命名颜色---线图

plt.plot([0,1],[0,1],sns.xkcd_rgb['pale red'],lw=3) #lw线宽
plt.plot([0,1],[0,2],sns.xkcd_rgb['medium green'],lw=3)
plt.plot([0,1],[0,3],sns.xkcd_rgb['denim blue'],lw=3)
plt.show()

输出:
Figure_1.png

2.4.3 sns.dark_palette()---核密度估计图

x,y=np.random.multivariate_normal([0,0],[[1,-5],[-.5,1]],size=300).T
pal = sns.dark_palette('green',as_cmap=True)
sns.kdeplot(x,y,cmap=pal)
plt.show()

输出:
Figure_1.png

3 因子变量绘图

3.1 boxplot箱线图

sns.boxplot(x='day',y='total_bill',hue='sex',data=tips)
plt.show()

输出:
Figure_1.png

3.2 小提琴图violinplot

图中白点为中位数,黑色盒型范围为下四分位点到上四分位点

sns.violinplot(x='day',y='total_bill',hue='sex',data=tips,split=True) #split=True 各取一半组成一个小提琴
plt.show()

输出:
Figure_1.png

3.3 散点图

3.3.1两类散点图

有两个散点图,stripplot和swarmplot,后者可以看出分布密度的散点图

sns.stripplot(x='day',y='total_bill',data=tips) #默认jitter=True
sns.swarmplot(x='day',y='total_bill',data=tips) #防止数据太密集
sns.swarmplot(x='day',y='total_bill',hue='sex',data=tips)
plt.show()

输出:
Figure_1.png
Figure_2.png
Figure_3.png

3.3.2 散点图与小提琴图结合

sns.violinplot(x='day',y='total_bill',data=tips,inner=None)
sns.swarmplot(x='day',y='total_bill',data=tips,color='w',alpha=0.5) #alpha透明度
plt.show()

输出:


Figure_1.png

3.3.3 散点图与箱线图图结合

sns.boxplot(x='day',y='total_bill',data=tips,whis=np.inf)#whis是否显示离群点,这里不显示
sns.swarmplot(x='day',y='total_bill',color='black',data=tips)
plt.show()

输出:
Figure_1.png

3.4 条形图barplot

sns.barplot(x='Sex',y='Survived',hue='Pclass',data=titanic)
plt.show()

输出:
Figure_1.png

3.5 点图pointplot

点图 描述差异性

sns.pointplot(x='Sex',y='Survived',hue='Pclass',data=titanic)
plt.show()
sns.pointplot(x='Pclass',y='Survived',data=titanic,
              palette={'male':'g','female':'m'},
              markers=['^','o'],linestyles=['-','--'],hue='Sex')
plt.show()

输出:
Figure_1.png
Figure_2.png

3.6 countplot计数统计图

sns.countplot('Pclass',data=titanic)
plt.show()

输出:
Figure_1.png

4 多层面板分类图

4.1线图

sns.factorplot(x='day',y='total_bill',hue='smoker',data=tips)
plt.show()

输出:
Figure_1.png

4.2 柱状图

sns.factorplot(x='day',y='total_bill',hue='smoker',data=tips,kind='bar')
plt.show()
Figure_1.png

4.3 散点图

sns.factorplot(x='day',y='total_bill',hue='smoker',data=tips,kind='swarm',col='time')
plt.show()

输出:
Figure_1.png

4.4 箱线图

sns.factorplot(x='time',y='total_bill',hue='smoker',data=tips,kind='box',col='day',size=4,aspect=0.5)#长宽比大小
plt.show()

输出:
Figure_1.png

5 回归图

sns.lmplot()和sns.regplot()

5.1 sns.regplot()

sns.regplot(x='size',y='tip',data=tips,x_jitter=0.5,color='g',marker='+')  #size的取值比较固定,可以让数据小范围浮动
plt.show()

输出:
Figure_1.png

5.2 sns.lmplot()

···
sns.lmplot(x='total_bill',y='tip',row='sex',col='time',data=tips,size=3)
plt.show()
···

输出:
Figure_1.png

6 分布图

6.1 直方图distplot和核密度曲线

直方图distplot(默认hist=False)和核密度曲线(默认rug=True)

np.random.seed(0)
x = np.random.normal(size=100)
sns.set_style('whitegrid')
sns.distplot(x,bins=20,color='g')
plt.show()

输出:
Figure_1.png

6.2 双变量关系图jointplot

sns.jointplot(x='total_bill',y='tip',data=tips)
plt.show()

输出;
Figure_1.png

通过kind参数可以拟合直线,拟合核密度图

sns.jointplot(x='total_bill',y='tip',data=tips,kind='reg')
plt.show()

输出:
Figure_1.png

使用六角形代替点,分辨哪个地方数值多

sns.jointplot(x='total_bill',y='tip',data=tips,kind='hex',color='k')
plt.show()

输出:
Figure_1.png

6.3 变量关系组图pairplot

绘制dataframe中各个变量两两之间的关系图

iris = sns.load_dataset('iris')
sns.pairplot(iris)
plt.show()

输出:
Figure_1.png

分组的变量关系图,挺好看

sns.pairplot(iris,hue='species')#不同的组可以用不同的形状标记markers=['o','s','D']
plt.show()

输出:
Figure_1.png

对角线可以绘制别的图

sns.pairplot(iris,diag_kind='kde')
plt.show()

输出:
Figure_1.png

7 热度图绘制

数据的变动用颜色表示出来,比如变量之间相关程度

np.random.seed(0)
uniform_data=np.random.rand(3,3)
print(uniform_data)
heatmap=sns.heatmap(uniform_data)
plt.show()

输出:
[[0.5488135 0.71518937 0.60276338]
[0.54488318 0.4236548 0.64589411]
[0.43758721 0.891773 0.96366276]]


Figure_1.png

可以设置最大值最小值

ax=sns.heatmap(uniform_data,vmin=0.2,vmax=0.5)
plt.show()

输出:
Figure_1.png

可以设置中心值

nurmal_data=np.random.randn(3,3)
print(nurmal_data)
ax=sns.heatmap(nurmal_data,center=0)
plt.show()

输出:
[[ 1.76405235 0.40015721 0.97873798]
[ 2.2408932 1.86755799 -0.97727788]
[ 0.95008842 -0.15135721 -0.10321885]]


Figure_1.png

进行一些参数设置

flights=sns.load_dataset('flights')
print(flights.head())
flights=flights.pivot(index='month',columns='year',values='passengers') #制成透视表
print(flights)
ax = sns.heatmap(flights,annot=True,fmt='d',linewidths=0.5)#annot标注数字,fmt字体,linewidths加线格,cmap调色板
plt.show()

输出:

   year     month  passengers
0  1949   January         112
1  1949  February         118
2  1949     March         132
3  1949     April         129
4  1949       May         121
year       1949  1950  1951  1952  1953  ...   1956  1957  1958  1959  1960
month                                    ...                               
January     112   115   145   171   196  ...    284   315   340   360   417
February    118   126   150   180   196  ...    277   301   318   342   391
March       132   141   178   193   236  ...    317   356   362   406   419
April       129   135   163   181   235  ...    313   348   348   396   461
May         121   125   172   183   229  ...    318   355   363   420   472
June        135   149   178   218   243  ...    374   422   435   472   535
July        148   170   199   230   264  ...    413   465   491   548   622
August      148   170   199   242   272  ...    405   467   505   559   606
September   136   158   184   209   237  ...    355   404   404   463   508
October     119   133   162   191   211  ...    306   347   359   407   461
November    104   114   146   172   180  ...    271   305   310   362   390
December    118   140   166   194   201  ...    306   336   337   405   432
Figure_1.png

8 Facetgrid使用方法

8.1 直方图

g = sns.FacetGrid(tips,col='time') #输入数据、col、row、hue等
g.map(plt.hist,'tip') #要画的图、x、y
plt.show()

输出:
Figure_1.png

8.2 散点图

g = sns.FacetGrid(tips,col='sex',hue='smoker')
g.map(plt.scatter,'total_bill','tip',alpha=0.7)#透明程度
g.add_legend() #标签
plt.show()

输出:
Figure_1.png

8.3 对比图

一般对比图

g=sns.PairGrid(iris)
g.map(plt.scatter)
plt.show()

输出:
Figure_1.png

设置对角线和非对角线图

g=sns.PairGrid(iris)
g.map_diag(plt.hist)
g.map_offdiag(plt.scatter)
plt.show()

输出:
Figure_1.png

分组绘图

g=sns.PairGrid(iris,hue='species')
g.map_diag(plt.hist)
g.map_offdiag(plt.scatter)
g.add_legend()
plt.show()

输出:
Figure_1.png

只选取两个变量

g=sns.PairGrid(iris,vars=['sepal_length','sepal_width'],hue='species')
g.map(plt.scatter)
g.add_legend()
plt.show()

输出:
Figure_1.png
g=sns.PairGrid(tips,hue='size',palette='PuBuGn_r')
g.map(plt.scatter,s=50,edgecolor='white')
g.add_legend()
plt.show()

输出:
Figure_1.png

8.4 指定顺序画图

from pandas import Categorical
ordered_days = Categorical(['Thur','Fri','Sat','Sun'])
g = sns.FacetGrid(tips,row='day',row_order=ordered_days,size=1.7,aspect=4)
g.map(sns.boxplot,'total_bill')
plt.show()

输出:
Figure_1.png

8.5 一些参数1

pal=dict(Lunch='seagreen',Dinner='grey')
g=sns.FacetGrid(tips,hue='time',palette=pal,height=5,hue_kws={'marker':['^','v']})
g.map(plt.scatter,'total_bill','tip',s=100,alpha=0.7,lw=0.5,edgecolor='white') #s:点的大小 ,edgecolor='white':点的外边线
g.add_legend()
plt.show()

输出:
Figure_1.png

8.6 一些参数2

sns.set_style('white')
g=sns.FacetGrid(tips,row='sex',col='smoker',margin_titles=True,height=2.5)
g.map(plt.scatter,'total_bill','tip')
g.set_axis_labels('total_bill($)','tip($)')
g.set(xticks=[10,30,50],yticks=[2,6,10])
g.fig.subplots_adjust(wspace=.02,hspace=.02) #子图之间的距离
plt.show()

输出:
Figure_1.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,544评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,430评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,764评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,193评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,216评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,182评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,063评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,917评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,329评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,543评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,722评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,425评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,019评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,671评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,825评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,729评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,614评论 2 353