0. 背景 日常日报、月报、季度报等中的主要内容都离不开核心指标的变化。除了展示指标变化的事实情况外,ld更关心指标变化背后的原因:什么因素改变导致了指标的变动?这个...
0. 背景 日常日报、月报、季度报等中的主要内容都离不开核心指标的变化。除了展示指标变化的事实情况外,ld更关心指标变化背后的原因:什么因素改变导致了指标的变动?这个...
@Zc_c 更更更,这周就更
使用gspread读写google spreadsheets (1)0.0 前言 使用Python操作micrsoft offce实现办公自动化能够极大的提高工作效率,包括 excel、word、powerpoint等。Google提...
0.0 前言 使用Python操作micrsoft offce实现办公自动化能够极大的提高工作效率,包括 excel、word、powerpoint等。Google提...
上一篇讨论了线性回归和逻辑回归的模型结构,以及从线性回归到逻辑回归的推导过程,这一篇将进一步比较两者的损失函数的异同。 1.0 线性回归 1.1 平方和损失函数&一般...
线性回归和逻辑回归在统计上都属于Conditional models(没找到标准中文译名),并且在sklearn中线性回归类LinearRegression 和逻辑回...
0.0 描述统计学和推断统计学 统计学是一门围绕数据展开的科学。从应用上看,可分为描述统计(descriptive statistics)和推断统计(inferent...
1.0 重识决策树 决策树是在已知各种情况发生概率的基础上,通过构成预测点,判断其是否会发生的分析方法,是直观运用概率分析的一种图解法。由于这种决策树分支的图形很像树的枝干,...
1.0 假设检验 假设检验是建立在否定式逻辑上的一类概率验证方法。 1.1 否定式逻辑 否定式逻辑:若 AB,则 ~B~A。举个例子,一般情况下若一个人性别为男性(A...
1.0 SVM解决回归问题 SVM思想也可以解决回归问题。回归问题的本质就是找到一根能够很好地拟合数据点的线(直线、曲线)。但不同回归算法对于拟合好坏的定义不同,比如线性回归...
SVM的本质上是一个线性分类器,并且引入了Margin区间的概念,保证Margin最大进而提高模型的准确性。Soft Margin对于SVM改善了模型泛化能力不足的问题,允许...
1.0 Soft Margin 1.1 Soft Margin的作用 在线性可分问题中,对于样本点来说,存在一根直线可以将样本点划分,就称之为Hard Margin SVM;...
1.0 什么是SVM 1.1 分类中的不适定问题 简单的分类问题例子:在二维的特征平面中,已有一条决策边界将所有的数据点分两类,即蓝色圆形和黄色三角。 但实际上,可以...
1.0高维数据向低维数据映射 仅仅提取一个数据集的n个主成分并没有对数据维度造成改变。但利用提取出的主成分能够选出使样本方差最大的(小于n个数的)维度,以此实现对数据...
1.0 梯度求解PCA 在求极值的问题中,有梯度上升和梯度下降两种最优化方法。梯度上升用于求最大值,梯度下降用于求最小值。在线性回归时,为找到是损失函数最小的参数值使用了梯度...
1.0 PCA简介 PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法,也是一种非监督的机器学习方法...
一类特殊的决策树算法——CART,Classification And Regression Tree。 1.0 CART简介 顾名思义,CART算法既可以用于创建分...
决策树是完全利用现有数据信息的分类拟合,为了避免过拟合、提高模型泛化能力,需要对建立好的树进行剪枝。尤其是当训练数据量大、特征数量较多时,所构建的决策树可能很庞大且复...
上一篇介绍了决策树中涉及的各分类依据指标的概念,信息增益、信息增益率和基尼系数。在构建树模型时选择的分类指标不同,就有不同的决策树构建方法,如本篇将要介绍的最经典决策树...
构建决策树的关键步骤在于特征的选择和划分,那么究竟如何选择最优的划分特征?又如何确定最合适的分割阈值?这些问题是基于信息论中的几个概念解决的,信息熵(informati...
0.0 初识决策树 决策树的思路非常简单,就是描述了人脑做决策的过程,整个决策过程使用树形结构进行描绘。树的每个内部节点为一个决策点,每个叶节点则为一个标签,即最后的决...