0x00 内容 学习内容:无监督聚类算法K-Means k-means:模型原理、收敛过程、超参数的选择 0x01聚类 聚类分析是在数据中发现数据对象之间的关系,将数据进行分...
0x00 内容 学习内容:无监督聚类算法K-Means k-means:模型原理、收敛过程、超参数的选择 0x01聚类 聚类分析是在数据中发现数据对象之间的关系,将数据进行分...
0x00 内容 如何提升数据可视化的表现效果 主要探讨一下,哪些方面的改进和有益实践,可以使我们的数据可视化的呈现效果更加具有表现力。 目标有两个: 了解哪些方面的因素,会对...
0x00 内容 决策树:决策树、信息熵、基尼系数、CART 实践:代码实现决策树 0x01 决策树 决策树的建模思路是尽可能模拟人做决策的过程。几乎没有任何抽象,完全通过生成...
0x00 内容 逻辑回归:损失函数、梯度、决策边界 实践:代码实现及sklearn逻辑回归 0x01 逻辑回归 逻辑回归(Logistic Regression,LR),LR...
0x00 目标 对比可视化中最常用的几种图表,区分它们的异同点及其适用的场景。 0x01 常用图表对比 以例子「可视化目标→数据集准备→图表选择和对比→经验总结」的方式做对比...
0x00 内容 梯度下降:实现梯度下降、线性回归中的梯度下降 随机梯度下降:相关代码即调用 0x01梯度下降法(回顾四:0x04梯度下降法) 最小二乘法求损失函数的最小值,但...
0x00 内容 区间型数据:了解区间型数据的特点,熟练使用「条形进度图、仪表盘、环形进度图」表示数据的进度和定量指标的定性化; 关系型数据:了解数据之间常见的关系类型,能熟练...
0x00 目标 简单线性回归:回顾简单线性回归及最小二乘法的数据推导 实践:简单线性回归实现及向量化应用 多元线性回归:多选线性回归和正规方程解及实现 0x01 简单线性回归...
0x00 可视化图表选择 两类不同的可视化目的及其可选择的图表形式。 「对比型数据」:对比两组或两组以上数据的差异。 「分布型数据」:研究数据分布的集中趋势、离散程度、偏态和...
0x00 可视化图表选择 0x01 时序数据可视化 时序数据,是指任何随着时间而变化的数据。 要进行时序数据的可视化,我们首先需要了解「时间」所具有的特征: 有序性:时间都是...
0x00 可视化 数据可视化不是简单的视觉映射,而是一个以数据流向为主线的一个完整流程,主要包括:数据采集、数据处理和变换、可视化映射、用户交互和用户感知。一个完整的可视化过...
0x00 目标 学习目标有四个: 无量纲化:最值归一化、均值方差归一化及sklearn中的Scaler; 缺失值处理; 处理分类型特征:编码与哑变量; 处理连续型特征:二值化...
0x00评价模型的好坏 1.数据拆分:训练数据集&测试数据集 2.评价分类结果:精准度、混淆矩阵、精准率、召回率、F1 Score、ROC曲线等 3.评价回归结果:MSE、R...
0x00kNN思想 kNN(k-NearestNeighbor),也就是k最近邻算法。顾名思义,所谓K最近邻,就是k个最近的邻居的意思。也就是在数据集中,认为每个样本可以用离...