《你一定爱读的极简统计学》——统计学离我们并不远

做指标管理、数据分析已经2年了,工作已经慢慢有了套路,但对于数据的应用基本上还处于各单位分析,而我来汇总的初级阶段。对于数据的有效性核查基本也只能靠直觉,靠熟悉程度,经验的经历是一定的,但成长的速度可真的是看不见的慢。为了让自己有提升专业能力,提高对数据的分析应用,本年的自我提升特别加入了专业的学习,而且特别制定了第一阶段90天数据分析能力提升入门计划,简单来说就要增加输入,同时以输出倒逼输入。

90天数据分析能力提升计划

输入:

专业的书籍——统计、数据分析

系统的培训——数说1-3季

工具的学习——透视表、仪表盘

公众号、微博

输出:

10篇读书笔记

1个改进项目

1项专项分析报告

指标仪表盘初稿


学习数据分析,统计学可谓是必学的知识之一。相对于其他的统计学书籍,各种正态分布、卡方分布、T分布的晦涩概念,《极简统计学》的内容没有那么的学术化,案例也贴合工作、生活,整个篇幅也就200页,并且每章后都有练习题,非常适合统计学初学者自学。下面记录一下自己读书的一些关键点及启示。

一、几个重要的统计概念

1.统计、概率的区别

统计是对过去事件的概述

概率是对于未来将发生事件的描述

2.样本——母体

样本就是我们平时可以获取的数据。

母体就是藏在少数样本后的庞大的全部数据。

3.平均值——就是直方图的平衡支点,主要作用是抵消偶然的数据分散、得出与实际值接近的值

直方图就是数据的分组频次,很直观,但不便于口头的交流,而且需要很大的空间,因此引入平均值。


样本均值——总体均值:观测的数据越多,样本均值接近总体均值的可能性越大。

电力系统里的平均值都是常见的是总体均值,如户均配变容量、客户平均停电时间、平均售电单价。

4.方差、标准差——主要作用是表明数据的分散和波动,搞清楚数据的分散程度。

引子:看看下面2组数据

100 200 平均值150

140 160 平均值150

这两组数据仅用平均值衡量,明显不合理。

再来一个书中的例子


所有引入方差、标准差来表明数据的分散和波动,通过标准差就能衡量是否是特殊的数据。以冲浪为例,平均值就是平静的海水平面,而标准差就是浪涌的激烈程度。

样本方差就是各样本偏差平方再取平均值。

二、重要应用:

1.如何比较股票的优劣呢?——夏普比率


电网企业的数据应用启示:可以计算各月售电量、停电时间;各设备类别的报废资产净值率、95598各类别投诉数量等分析指标的标准差、方差的指标,用于分析指标是否异常。

2.利用正态分布进行预测——所谓95%的置信区间

一般正态分布:平均值为μ,标准差为σ。(标准正态分布平均值为0,标准值为1。)

(1)数据x是平均值为μ,标准差为σ的正态分布时,95%的预测命中区间的不等式为


电网企业的数据应用启示:可以根据历史数据计算总体的均值和标准差,进而计算95%的置信区间,做为数据收集、数据清理时的有效性检查。

(2)已知母体为正态分布,标准差σ已知,平均值μ未知,由观察的数据来对μ进行母体的区间估计。(实际情况较难实现标准差σ已知,可能出现的是机器生产已经给定标准差)


电网企业的数据应用启示:可以用于精益项目改善的前后的现状检查及效果评估。可以用于零售行业的销售情况的测算、可以用于统计各人员的操作时间计算等等。

3.利用T分布估算总体均值

T分布称为“自由度n-1的t分布”。这个分布非常近似于正态分布,主要通过计算样本均值和样本方差,来估算总体的均值。t分布是推论统计中最自然、最实用、最常用的方法。

4.利用卡方分布估算总体方差


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,941评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,397评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,345评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,851评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,868评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,688评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,414评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,319评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,775评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,945评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,096评论 1 350
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,789评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,437评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,993评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,107评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,308评论 3 372
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,037评论 2 355