可视化常见绘图(三)面积图
一.面积图简介
面积图又叫区域图。 它是在折线图的基础之上形成的, 它将折线图中折线与自变量坐标轴之间的区域使用颜色或者纹理填充,这样一个填充区域我们叫做面积,颜色的填充可以更好的突出趋势信息。
需要注意的是颜色要带有一定的透明度,透明度可以很好的帮助使用者观察不同序列之间的重叠关系,没有透明度的面积会导致不同序列之间相互遮盖减少可以被观察到的信息。
和折线图一样,面积图也用于强调数量随时间而变化的程度,也可用于引起人们对总趋势的注意。他们最常用于表现趋势和关系,而不是传达特定的值。
面积图通常分为两类:
一般面积图:所有的数据都从相同的零轴开始。
堆叠面积图:每一个数据集的起点不同,都是基于前一个数据集。用于显示每个数值所占大小随时间或类别变化的趋势线,堆叠起来的面积图在表现大数据的总量分量的变化情况时格外有用。
百分比层叠面积图:用于显示每个数值所占百分比随时间或类别变化的趋势线。可强调每个系列的比例趋势线。
二.面积图的组成
一般的面积图由以下四个部分组成:
横轴:表示时间。
纵轴:表示数值。
线:表示数据之间的趋势关系。
面积:线条与轴之间的填充面积。
三.使用场景
适合的数据:两个连续字段的数据。
主要功能:观察数据的变化趋势。
适用的场景:
- 展示时间维度上变化的值。
不适用的场景:
- 不适用不同分类之间的数值比较。
四.实现
在matplotlib
中绘制面积图需要两个函数,plot
和fill_between
。plot
用来绘制折线,fill_between
用来进行面积填充。fill_between
方法介绍如下:
fill_between(x, y1, y2=0, where=None, interpolate=False, step=None, *,data=None, **kwargs)
参数1:x:长度N的数组,执行曲线的X轴跨度。
参数2:y1:长度N的数组或者标量,指定第一条曲线。
参数3:y2:长度N的数组或者标量,指定第二条曲线。(默认值0)
参数4:where:长度为N的布尔类型数组,指定填充的位置。
参数5:interpolate:布尔型,未知。
参数6:step:限定字符串:指定填充是否使用阶跃函数,可选:
pre
:y 值从每个x位置不断向左继续。post
:y 值从每个x位置不断向右继续。mid
:阶跃发生在x位置的中间。
参数7:**kwargs:接受的关键字参数传递给关联的PolyCollection对象。
返回值:PolyCollection对象。
注:
实现完整代码:
import matplotlib.pyplot as plt
import numpy as np
plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置支持中文
plt.rcParams['axes.unicode_minus'] = False # 设置-号
plt.style.use('seaborn-notebook')
# 使用的数据集
year = [1950, 1960, 1970, 1980, 1990, 2000, 2010, 2018]
asia_population = [1394, 1686, 2120, 2625, 3202, 3714, 4169, 4560]
y_label = np.arange(0, 5000, 500)
avg = np.average(asia_population)
plt.plot(asia_population, lw=3, color='k', label="Asia's population")
plt.hlines(avg, -5000, 5000, ls='--', label=f"average:{avg}", color='red')
plt.fill_between(range(len(year)), asia_population, alpha=0.3)
plt.title("亚洲人口变迁(1950-2018)", fontsize=25, fontweight='bold')
plt.xlabel("年份", fontsize=15)
plt.ylabel("人口数(百万)", fontsize=15)
plt.xticks(range(len(year)), labels=year, fontsize=10)
plt.xlim([-0.5, len(year)-0.5])
plt.grid()
plt.legend(fontsize=15)
plt.show()
实现效果如下: