Avatar notebook default
4篇文章 · 2362字 · 1人关注
  • 数据转换处理之规格化:十基数变换规格化算法

    规格化就是将一个属性取值范围投射到一个特定范围之内,以消除数值型属 性因大小不一而造成挖掘结果的偏差。规划化处理常常用于神经网络、基于距离 计算...

  • 数据转换处理之规格化:零均值规格化算法

    规格化就是将一个属性取值范围投射到一个特定范围之内,以消除数值型属 性因大小不一而造成挖掘结果的偏差。规划化处理常常用于神经网络、基于距离 计算...

  • 数据转换处理之规格化:最大最小规格化算法

    规格化就是将一个属性取值范围投射到一个特定范围之内,以消除数值型属 性因大小不一而造成挖掘结果的偏差。规划化处理常常用于神经网络、基于距离 计算...

  • TF-IDF算法:提取关键词

    想要提取一篇文章的 关键词 ,最直接的思维方式就是出现的越频繁的词就意味着越重要,但停用词需要除外。一篇文章中出现最多的就是停用词,只有避开这些...

文集作者