作业一飞机乘客
从两个方面对这组数据进行分析:
1)计算每年的飞机乘客数据,然后进行分析
作业代码及具体过程:
数据分析:
计算出每年的乘客数量,可以从直方图中得出:1)数据在1600~2100,以及2300~2800这两个区间最多,数量各位3个;2)数据在人数较少的区间和人数较多的区间集中,而在中间区间较少,呈现出一定的不均匀性;3)从得出的数据来看,乘客数量呈现逐年增长的趋势(从data_b中得出);4)计算出每年的数据后,不太适合通过直方图分析(数据量太少),除此外,还读取不出其人数随着时间的一个变化情况,此时通过折线图或许更利于数据分析。
2)直接对原始数据进行分析
作业代码及具体过程:
分别将组数修改为15,20,其计算结果如下:
数据分析:
1)随着组数的增加,观察到的数据的细节更为丰富,但是也增加了对规律的把握;2)人数在100至200的三个区间和350到370的区间内的月数出现的最多;3)人数大于450的月数比较少,低于三次。
作业二 体重数据分析
代码及具体过程:
数据分析:
1)体重主要集中在45~50这个区间,其频次均超过了10;2)少于43以及大于57的数据很少,其频次少于4;3)增加组数可以展现出数据更为丰富的特征,但是太复杂不利于我们去进行数据分析——合理的选择组数很重要。