一、常用的特征缩放算法有两种: 归一化(normalization)和标准化(standardization) 二、归一化(normalization) 1、什么是归一化 归...
IP属地:广东
一、常用的特征缩放算法有两种: 归一化(normalization)和标准化(standardization) 二、归一化(normalization) 1、什么是归一化 归...
标准差 在统计中,标准差是一种用于量化一组数据值的变化或分散程度的度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。 ...
讲到统计学,终究会谈到假设检验的问题,做过数据分析的人也都是耳熟能详, 但如果让你具体讲讲假设检验的原理, 什么是P值,为什么用t检验,为什么用F检验,估计能问倒一操场。 作...
两个值均应用于假设检验中。显著性水平为实验之前人为确定的值,如0.05、0.1等,用α表示。表示原假设为真时,拒绝原假设的概率,即犯错误的概率。 根据α,可以求出相应的分位数...
网上搜罗一圈,感觉资料有些乱,稍微总结了一下。 斯皮尔曼补充(图片节选自wikipidia):
前言 PCA是一种线性降维算法,不能解释特征之间的复杂多项式关系。如果特征与特征之间的关系是非线性的话,用PCA可能会导致欠拟合的情形发生。 线性降维算法的一个主要问题是它们...
本文结构: 学习曲线是什么? 怎么解读? 怎么画? 学习曲线是什么? 学习曲线就是通过画出不同训练集大小时训练集和交叉验证的准确率,可以看到模型在新数据上的表现,进而来判断模...
使用sklearn的DecisionTreeClassifier解决分类问题实例。 数据集描述 数据集存放在一个csv文件中,其中11列特征变量,1列目标变量。特征变量的类型...