数据归一化方法

在应用过程中,由于输入数据变化范围大等原因会在一定程度上增加计算复杂程度、不平衡性以及训练时间等,为避免上述情形,并消除不同量纲等因素的不利影响,首先应对数据值进行归一化处理。

1、传统归一化方法

                                                            x_{ai} =\frac{max(x)-x_{i} }{max(x)-min(x)}

x_{ai}表示归一化后的值,max(x)和min(x)为取各个样本中的最大值和最小值。使用该方法可将样本值限定于[0,1]范围内。使用该方法可描述各分量在总量中的相对关系,然而也会减小样本间的差异,特别是对不同类别以及数据差异较小的样本影响较大,从而降低判断准确率。

2、[0.1-0.9]归一法

                                            x_{ai} =0.1+\frac{max(x)-x_{i} }{max(x)-min(x)}\times (0.9-0.1)

按照这种方法处理数据,使输入数据位于0-1之间的同时,还能够拉开每一个样本之间的数据差异。

3、正态归一化方法

该方法是将数据转化为均值为0,标准差为1的正态分布数据,如下所示:

                                                    P_{i} =\frac{x_{i} -\tilde{x} }{s} ,i=1,2,...,n

其中\tilde{x}是所有数据的平均数,s表示对应的标准差,其表达式为:

                                                                \tilde{x} =\frac{x_{1} +x_{2} +...+x_{n} }{n}

                                    s=\sqrt{\frac{(x_{1}-\tilde{x} )^2 +(x_{2}-\tilde{x})^2 +...+(x_{n}-\tilde{x})^2}{n} }


写在最后:文章是在学习过程中做的学习笔记,同时与志同道合者分享,文章内容均经过我自己实验证实可行,如有问题欢迎留言,很高兴一起交流讨论,共同进步!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。