python绘制动态可视化图

今年定下了很多目标,立了很多flag,但是很可惜,到目前为止,实现的并没有多少,还剩下几天的时间就到2020了,趁着这个周末,还是再完成一个flag吧。

今天要做的是一个动态图表,起因是在一个ted演讲上面,看到了统计学家Hans Rosling的一篇演讲,觉得挺有意思的,就拿来数据自己实验一下
https://www.bilibili.com/video/av36510825
视频中的展示链接:https://www.gapminder.org/tools/#$chart-type=bubbles
这里使用matplotlib高仿一版,看看效果。

纵轴liftspan人均寿命,横轴income(人均收入),点代表国家,不同颜色表示地区,气泡大小表示人口数量。
拆分省份,最后一年展示下省份之间的差距

实现方式是通过python中的绘图模块matplotlib中的animation模块实现,实现原理就是循环创建图片,然后按帧合成为动画,当然,最后不一定能100%实现,来做个高仿版本的。

这篇文章既是实现该目标的过程,也是对python中的matplotlib库做个复习。

一、准备数据源

首先是找到相关的数据源,这里数据源来自于展示链接中,我这里直接存储在百度网盘中,链接在最下面,需要的可以点击获取,第一步是将数据导入其中

# 导入用到的python模块
import pandas as pd
import json 
import numpy as np
# 读取表格中的收入数据到2018年
df_income = pd.read_csv(r'D:\Jupyter Notebook\33 可视化\data\income_per_person_gdppercapita_ppp_inflation_adjusted.csv'
                        ,encoding='utf-8').iloc[:,0:220]
# 读取表格中的寿命数据
df_lifespan = pd.read_csv(r'D:\Jupyter Notebook\33 可视化\data\life_expectancy_years.csv',encoding='utf-8').iloc[:,0:225]

# 读取表格中的人口数据到2018年
df_population = pd.read_csv(r'D:\Jupyter Notebook\33 可视化\data\population_total.csv',encoding='utf-8').iloc[:,0:220]

# 读取json文件中的国家与州的数据
df_relation = pd.read_json(r'D:\Jupyter Notebook\33 可视化\data\country_continent.json',encoding='utf-8')

最后读取的数据内容如下图:


数据内容

二、合并数据源为指定的格式

需要将数据源合并成类似的格式,这样方便生成后续图表。


指定数据格式
# 使用pandas的merge函数合并
df_tmp = pd.merge(df_income,df_lifespan,how='inner',on='country',suffixes=('_income', '_lifespan'))
df_tmp2 = pd.merge(df_population,df_tmp,how='inner',on='country') #此时左右列没有重叠,故suffixes字段无效
df = pd.merge(df_relation,df_tmp2,how='inner',left_on='country_name',right_on='country')
df.head()
合并结果

值得注意的是,这里在合并population的过程中并没有将相关的数据加上后缀,因为合并时候的字段并不一致,这就导致population的数据是没有"-population"的后缀的,如果有强迫症的自己重命名一下列。

三、生成基础matplotlib图形格式

这里需要使用matplotlib模块生成我们要做的基本格式,这里偷个懒,把以前我经常用的格式直接导入进来。

# 导入基础的matplotlib配置
import matplotlib as mpl
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker 
import matplotlib.animation as animation
large = 22; med = 16; small = 12 #其余字体大小统一设置为14
params = {'axes.titlesize': large,
          'legend.fontsize': med,
          'figure.figsize': (15, 8),
          'axes.labelsize': med,
          'axes.titlesize': med,
          'xtick.labelsize': med,
          'ytick.labelsize': med,
          'figure.titlesize': large}
plt.rcParams.update(params)
plt.style.use('seaborn-whitegrid') #更改模块风格
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签 plt.rcParam
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
# plt.rcParams['savefig.dpi'] = 300 #保存图片像素
plt.rcParams['animation.embed_limit' ] = 100 #限定animation的生成
# 导入百度echart的一组颜色卡
r_hex = '#dc2624'     # red,       RGB = 220,38,36
dt_hex = '#2b4750'    # dark teal, RGB = 43,71,80
tl_hex = '#45a0a2'    # teal,      RGB = 69,160,162
r1_hex = '#e87a59'    # red,       RGB = 232,122,89
tl1_hex = '#7dcaa9'   # teal,      RGB = 125,202,169
g_hex = '#649E7D'     # green,     RGB = 100,158,125
o_hex = '#dc8018'     # orange,    RGB = 220,128,24
tn_hex = '#C89F91'    # tan,       RGB = 200,159,145
g50_hex = '#6c6d6c'   # grey-50,   RGB = 108,109,108
bg_hex = '#4f6268'    # blue grey, RGB = 79,98,104
g25_hex = '#c7cccf'   # grey-25,   RGB = 199,204,207
色卡

接下来就是绘制的重点,animation的绘制方式就是不断渲染图片,所以,我们需要自定义一个数据的生成过程。这里要注意两点,第一是创建该函数的时候不能创建画布,只能保留绘制过程,画布的创建应该在animation里面创建;第二是由于x轴incom的分布并不是均匀的,越到后面数据相差越大,为了不影响美观性,这里需要对x轴进行标尺变换,即x轴的坐标是[500,1000,2000,4000,8000,16000,32000,64000],是翻倍类型的坐标轴,如果采用原坐标轴的话势必会导致数据分布的不均匀,故,这里采用matplotlib中标尺变换功能,将x轴进行变换,我们并没有更改数据的值,只是改变了显示方式。请务必在 xscale 之后指定 xticks,因为该函数具有内置的刻度设置。

#绘制基础画布
# fig, ax = plt.subplots(figsize=(15, 8))

def draw(year):    
    ax.clear()
    year=year
    income = str(year)+'_income'
    lifespan = str(year)+'_lifespan'
    population = str(year)
    tmps = df[[income,lifespan,population]]

    #增加画布的标题
    fig.suptitle('人均收入与寿命之间的关系',color=dt_hex)

    #在图片中插入文本,设定对齐方式
    plt.text(7000, 45, year ,fontsize=300,color=bg_hex,alpha=0.25,horizontalalignment='center',verticalalignment='center')

    # x轴设定为income,y轴设定为liftspan,
    plt.xlabel('人均收入',fontsize=20,color=dt_hex)
    plt.ylabel('预期寿命',fontsize=20,color=dt_hex)

    #进行x轴标尺转换,这一步要放在xticks之前,因为该函数具有内置的刻度设置
    plt.xscale('log')

    #插入图表
    plt.scatter(x=tmps[income],y=tmps[lifespan],s=tmps[str(year)]/100000,alpha=0.6)

    #设定x轴、y轴的坐标尺寸
    plt.xticks([500,1000,2000,4000,8000,16000,32000,64000,128000],['500','1000','2000','4000','8000','16k','32k','64k','128k'],alpha=0.6)
    plt.yticks(list(range(0,100,10)),alpha=0.6)
    
    #plt.show()

接下来就是重点了,调用matplotlib的animation方法生成动态图表,并调用html方法展示出来

import matplotlib.animation as animation
from IPython.display import HTML
fig, ax = plt.subplots(figsize=(15, 8))
animator = animation.FuncAnimation(fig, draw, frames=range(1800, 2019))
HTML(animator.to_jshtml()) 
动态可视化图表

最后,导出生成的动态可视化图表为gif

animator.save('save.gif',writer='imagemagick') 
# windows需要安装imagemagick软件,并配置到系统路径中

遗留的问题:

  1. 展示界面太丑,并且缺失了洲维度数据的展示
  2. 没有对主要的国家进行注释
  3. 最后导出的gif图片无法播放,不清楚是什么原因

相关数据链接:
链接: https://pan.baidu.com/s/1pPzlUeyzh5GE4b1bmjr0Bw 提取码: p9gz

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,561评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,218评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,162评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,470评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,550评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,806评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,951评论 3 407
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,712评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,166评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,510评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,643评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,306评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,930评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,745评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,983评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,351评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,509评论 2 348

推荐阅读更多精彩内容