描述性分析:
均值:对离群值十分敏感,只有在数据分布均匀的情况下,才能更好的反映问题。
中位数:当数据存在较多的离群值时,能反映数据集的中间程度。
众数:说明哪些数据更具有代表性。
方差:反映数据的波动大小(方差越大,波动越大Var)
协方差:反映两组数据之间的线性相关关系,协方差为正,两组数据正相关,协方差为负,两组数据负相关。
泊松分布:描述单位时间内随机事件发生次数的概率分布。(如某鞋店每天卖出13,5,6,7双鞋的概率是多少),帮助商店决定进多少货,最大程度上利用仓库空间。
指数分布:独立事件发生的时间间隔的概率,可以使用指数分布描述。(如公交站台上每分钟平均3个人等公交车,那么第一个人到公交站台之后,第二个到来的时间间隔为0.5分钟,1分钟,2分钟的概率是多少。)