本文主要是对《R语言实战》第五章的实践练习,参考本职工作中经常需要用到的绘制产品质量控制图,看了第五章后,发现里面用到的一些统计学函数可以用在产品质量控制图。因此,就以本文加强自己的练习。
一、目的
假设产品尺寸要求是148~150mm,分析产品的Cpk,和绘制产品的均值-极差图,通过Cpk和均值-极差图分析该产品的质量是否属于可控制范围,也就是说产品是否出现质量问题。
二、数据处理步骤
1.生成数据
由于目前没有实际数据在手,所以用了随机函数,生成所需要的服从正态分布的函数。
生成平均值为150.04、极差为0.5的100个服从正态分布的数据。同时使用了set.seed()函数,让随机生成的数据可以重复。
![](https://pic4.zhimg.com/v2-df0882bc5cd5e579be9d23a45b616e13.png)
2.将数据由向量转换成矩阵
![](https://pic3.zhimg.com/v2-fda5c32a766be72f015f26fdd8958749.png)
3.对数据进行计算
计算每一列的均值,然后再计算均值的均值:
![](https://pic1.zhimg.com/v2-66b45334cfe4febd1a92033a21f25700.png)
计算每一列的极差,然后在计算极差的均值:
![](https://pic1.zhimg.com/v2-b4208f822fa14f64f51194d07013c998.png)
计算标准差:
![](https://pic2.zhimg.com/v2-12627efa9def02a09e87c69469bc6526.png)
计算Cpk,计算Cpk之前,需要计算CpUCL和CpLCL,然后这两者的最小值就是Cpk。其中:
CpUCL=(规格上限-平均值)/(3标准差)
CpLCL=(规格上限+平均值)/(3标准差)
且,产品的Cpk≥1.33方可以接受。
![](https://pic3.zhimg.com/v2-2dfe8640877a523cd5885b1505aebd42.png)
随机生成的数据,产品的Cpk等于1.33,处于刚好到达临界值。
计算均值图的上下限:
![](https://pic2.zhimg.com/v2-8c8f9d1d7231e501e813ed9b84624c06.png)
![](https://pic1.zhimg.com/v2-6e60e43a9386c426838f89b6fae26f9f.png)
计算极差图的上下限:
![](https://pic1.zhimg.com/v2-397439d909d7be8a8532fa3322c409b2.png)
三、绘制数据分析图
1.绘制均值图![](https://pic4.zhimg.com/v2-b0be0d067984ef8611dae009263f9e39.png)
![](https://pic2.zhimg.com/v2-af7b7521181e83a498d6090be1223d14.png)
从图中可以看出来,数据没有超出上下限,且没有连续7个点落在同一边,均值附近的点也不多,产品尺寸在可控制的范围内。
2.绘制极差图
![](https://pic4.zhimg.com/v2-fdb6563956d65cdbe0470cc1bbc4636b.png)
![](https://pic1.zhimg.com/v2-e3f6534b0e0a2174cd4e7af13a23288d.png)
从图中可以看出,后面的八个数字在均值的一边,属于异常数据,需要进一步进行原因分析。
3.将两个图组合在一起
接下来,就需要考虑异常数据的分析~
总结:
第一次将R语言运用在工作中,之前都是用的Excel完成的,利用R语言后,发现相对来说要简单多了,不需要将数据一个个套用公式,而且数据可视化这点也比用Excel方便很多。接下来继续找数据练习~