餐饮销量数据统计量分析

离中趋势度量
1.极差:极差对数据集的极端值非常敏感,并且忽略了位于最大值与最小值之间的数据的分布情况
2.标准差:标准差度量数据偏离均值的程度,计算公式:



3.变异系数:变异系数度量标准差相对于均值的离中趋势,计算公式为:



4.四分位数间距
四分位数包括上四分位数和下四分位数。将所有数值由小到大排列并分成四等份,处于第一个分割点位置的数值是下四分位数,处于第二个分割点位置(中间位置)的数值是中位数,处于第三个分割点位置的数值是上四分位数。
四分位数间距,是上四分位数Qu与下四分位数Ql之差,其间包含了全部观察值的一个半。值越大,说明数据的变异程度越大;反之,越小。
#-*- coding: utf-8 -*-
#餐饮销量数据统计量分析
from __future__ import print_function
import pandas as pd

catering_sale = 'G:/PycharmProjects/数据分析与挖掘/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列
data = data[(data[u'销量'] > 400)&(data[u'销量'] < 5000)] #过滤异常数据
statistics = data.describe() #保存基本统计量

statistics.loc['range'] = statistics.loc['max']-statistics.loc['min'] #极差
statistics.loc['var'] = statistics.loc['std']/statistics.loc['mean'] #变异系数
statistics.loc['dis'] = statistics.loc['75%']-statistics.loc['25%'] #四分位数间距

print(statistics)

mean:平均值 std:标准差

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 记得是从腊八之后,催促回家的信息就从天南地北传来,各个表兄堂弟、七大姑八大姨的,年味儿渐浓,归心似箭。 在贴近年关...
    一段小文阅读 517评论 0 1
  • 那天同事兴奋地打来电话,告诉我有一个节目你一定喜欢,叫《中国诗词大会》。 《诗词大会》?这个栏目名多少还是触动了我...
    不爱墨迹阅读 702评论 0 1
  • 既然给人以希望,却又为何忍心微笑着离去
    知智也阅读 240评论 0 0
  • 1、人生本来就没有相欠,别人对你付出,是因为别人喜欢,你对别人付出,是因为自己甘愿。情出自愿,事过无悔。 2、和聪...
    上善若水_张建国阅读 298评论 0 0