数据分析50图(一) —— 序幕

前言

华罗庚说过

数缺形时少直观,形少数时难入微.

这句话第一次听还是初中数学老师上二次方程课时说的.

最近看到了3blue1brown对线性代数的直观解释感觉豁然开朗,于是我又捡起了儿时对美妙数学的兴趣. 发现一个博客,数据可视化很好的例子,决定花些时间和大家一起解读一下

例程来自:https://www.machinelearningplus.com/plots/matplotlib-histogram-python-examples//

感谢b站UP "菜菜TsaiTsai" 分享这个博客.

在正式开始“50图”的学习前先引出2个前例,目的是提醒自己。学会是从有限的例子中推论出没有见过的问题的答案。这也是2000年前对孔子对学会的理解“温故而知新,可以为师已”

前例1

import numpy as np
x = np.random.randint(low=0, high=100, size=100)

# Compute frequency and bins
frequency, bins = np.histogram(x, bins=10, range=[0, 100])

# Pretty Print
for b, f in zip(bins[1:], frequency):
print(round(b, 1), ' '.join(np.repeat('*', f)))

解析

首先在0-100里产生一些随机的整数 histogram 直方图统计函数:

  • bins 均匀分成的区间数量,10表示分成10个区间
  • range 统计的范围,这里与原数据的定义域相同,但也可以是不同的。

最后画出来像是这样


微信截图_20190327135305.png

应用

事实上,我们生活中更多的用的直方图,或是折现图往往表示一个趋势的记录。比如房价走势

房价走势.jpg

我们直觉上总是更容易理解时间相关的表达。因为我的大脑的生产逻辑是基于过去的经验的。引用一句名言“你用永远成为不了你没见过的人。” 不过科学家们,特别是物理学家们,更常用另一种表达方式就是本例中的计次,他事实上是一种时频域转换,这在许多问题是非常有效,我们继续看下去。

前例2

import matplotlib.pyplot as plt
%matplotlib inline
plt.rcParams.update({'figure.figsize':(7,5), 'figure.dpi':100})

# Plot Histogram on x
x = np.random.normal(size = 1000)
plt.hist(x, bins=50)
plt.gca().set(title='Frequency Histogram', ylabel='Frequency');

解析

  • rcParams 设定一些图像的大小等参数;

  • random.normal 产生一个 符合标准正态分布的集合,loc 中心默认为0。

  • plt.hist 与例1相同,2个参数,数据集合x,间隔数bins。不同的是他帮忙画出了一些有颜色矩形,矩形的高度代表次数的大小,宽度代表间隔的长度

微信截图_20190327141933.png

应用

不得不说,我们人类的构造就是适合处理这些颜色和形状,我们会不自觉的把目光投降这些有规律的色块,就行我们看一幅美术作品一样

来想一想这中频次图,适合表达什么?

比如同一时间下,不同地区的房价,我们可以想象,主城区不少房子价值高昂但是黄金地段有些数量不会太多,这些房子出现在上图的右边。而稍远一些的大部分房子在横轴的0值附件。这里我们举了一个例子,那么我们倒过来想一下,一个现象符合某种条件规律,反过来某个条件能否推出一个现象?

上例我们知道不同地区房价不同,反过来,根据房价不同不就能知道房子的地段的了吗?当然这里有个前提,这种关系需要是对应的。就想数学中的函数与反函数 。可以科学实验中的常用手段。观察现象、总结规律,然后得到背后的结论。

下期预告

图1 散点图

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,347评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,435评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,509评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,611评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,837评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,987评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,730评论 0 267
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,194评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,525评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,664评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,334评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,944评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,764评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,997评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,389评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,554评论 2 349

推荐阅读更多精彩内容

  • 论CSS常用单位的前世今生 目录: 一、---------------------------浅析CSS的组成 二...
    Marting424阅读 2,820评论 0 3
  • 在 Python 中,日期和时间可能涉及好几种不同的数据类型和函数。 下面回顾了表示时间的 3 种不同类型的值: ...
    swagsmile阅读 196评论 0 0
  • 早春来临的盘克镇和金村乡乡间小道上,太阳好像刚从冬眠中睡醒的样子,悬在蔚蓝的天空中绽放着刺眼却并不灼热的光芒...
    桃夭0阅读 409评论 0 0
  • 之前有一个新词,叫懒癌,用来形容那些懒得无药可救的人,很有甚者,再加上一个程度词,懒癌晚期,那更是没得救了!而...
    A学而佳阅读 175评论 0 0
  • 知识的海洋无边无际,望不到尽头,百家争鸣或百花齐放,置身其中,渺小如尘埃,敬畏中夹杂太多窘迫感,因为你的局限和无知...
    another琼阅读 125评论 0 0