书中的实例,练习数据规范化处理
我们的数据集
首先加载数据集
df = pd.read_excel(data_path , header=None)
df
前面说过,规范化有几种方式
- 最小-最大规范化
在pandas处理这件事情非常简单
( df - df.min() ) / ( df.max() - df.min() )
规范化之后,会有0值和1,因为一定会有最小值和最大值在其中
- 零-均值规范化
( df - df.mean() ) / df.std()
还有一个小数定标的例子,感觉暂时不用,也是很简单的,后面真正使用的时候再继续
附录
pandas中常用的统计函数