在我有限的理解中,标准化和归一化只是同一种方法的不同叫法,毕竟英文都可以是normalization。在看完这篇文章后http://www.raincent.com/content-10-12066-1.html,我更加困惑了。这篇文章首先将归一化和标准化相区别。
归一化和标准化都是对某个特征进行缩放而不是对某个样本的特征向量进行缩放。
但在之后的举例中只涉及了标准化,而且标准化和归一化的概念混着用,我:... ...
但文中提及的一个词让我很感兴趣——特征缩放
。
特征缩放 Feature scaling
Feature scaling is a method used to normalize the range of independent variables or features of data. In data processing, it is also known as data normalization and is generally performed during the data preprocessing step.
将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
特征缩放的作用包括:
特征缩放的方法有四种:
Rescaling (min-max normalization)
把数据缩放到[0, 1] 或 [−1, 1]。如果是[0, 1] ,则算法如下
将数据映射到[a,b]区间,
Mean normalization
There is another form of the mean normalization which is when we divide by the standard deviation which is also called standardization.
Standardization (Z-score Normalization)
最常见的标准化方法就是Z标准化,也是SPSS中最为常用的标准化方法,spss默认的标准化方法就是z-score标准化。
也叫标准差标准化,这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。
经过处理的数据符合标准正态分布,即均值为0,标准差为1,注意,一般来说z-score不是归一化,而是标准化,归一化只是标准化的一种https://blog.csdn.net/pipisorry/article/details/52247379
z-score
Scaling to unit length
模糊理解,归一化和标准化都属于特征缩放,归一化属于标准化中的一种,只是通过不同方法将数据缩放到[0, 1]区间(所以才叫作归一?)
RNA-seq reads count normalization
这里应该可以理解为标准化吧,毕竟处理过的数据也不[0, 1]之间。
具体可以阅读这篇//www.greatytc.com/p/a9d5065f82a6