Obsidian&Zettelkasten&LYT系列文章的总目录[//www.greatytc.com/p/6be9cbb134de] 通过前面几篇扫盲式的...
Obsidian&Zettelkasten&LYT系列文章的总目录[//www.greatytc.com/p/6be9cbb134de] 通过前面几篇扫盲式的...
现在也支持 iCloud 文件同步了
自己动手组建可远程实时同步的obsidianObsidian&Zettelkasten&LYT系列文章的总目录[//www.greatytc.com/p/6be9cbb134de] 前几篇我们介绍了ob...
Enron事件背景,以及通过外部信息列出的可能的嫌疑人(POI)。 一般来说,可供训练的数据越多,效果越好。 基本的数据类型判断练习。 迷你项目(略)
决策树利用核技巧,把简单的线性决策面,转换为非线性决策面。一个接一个的处理多元线性问题。根据数据,算法自动找出决策边界决策树 sklearn中的决策树:import、tree...
SVM寻找一条直线或超平面,将输入数据分隔成两类。好的分隔线可以最大化间隔最大化MarginSVM首先考虑是否正确分类,其次才是最大化间隔。同时,可以做到忽略异常值,在忽略异...
sklearn中的cross validation from sklearn import cross_validation features_train, features...
上篇文章,我们一起学习了数据产品经理日常中接触最多的“数据仓库”的一些基本概念和常见的一些专用名词,他们都是数据产品经理成长,学习和实操中不可或缺的重要一环。在数据仓库中,我...
PCA(Principal Component Analysis)是一套全面用于各类数据分析的分析方法,包括特征集压缩。每当需要将数据直观化的时候,都可以采用。PAC特别适用...
方法一:加入新特征的通过直觉构建代码实现可视化评估重复上述过程 警惕特征漏洞任何人都有可能犯错—要对你得到的结果持怀疑态度!你应该时刻警惕 100% 准确率。不寻常的主张要有...
通过练习了解词袋及其属性:无序文本长度影响算法结果对复合短语处理能力不足 在sklearn中的使用CountVecterizer即可理解为词袋 停止词stop words指文...
通过衣服尺码的例子,介绍一种使用特征缩放的简单情况 一种简单的特征缩放公式(归一化)和实现归一化特征缩放公式 sklearn中的Min-Max Scalar特征缩放器 哪些算...
聚类算法是一种非监督类型的机器学习算法,并通过电影分类解释聚类算法应用场景。 K-Means算法讲解:确定聚类(簇)中心,通过计算各点到中心的距离,迭代优化中心的位置;一个在...
通过3个联系,直观认识异常值outliers 异常值检测/删除算法:训练->删除误差最大的10%数据->再训练使用残差residual error检测异常值异常值删除策略 异...
通过大量小练习,直观学习:判断连续与离散分布简单的回归方程,斜率slope和截距intercept的概念使用回归方程进行预测 使用sklearn进行回归分析 线性回归的误差e...
Google 无人驾驶汽车中的机器学习通过Google的无人驾驶例子,简要介绍监督学习和非监督学习;本章介绍的算法均为监督学习;区分监督学习和非监督学习的小测试 特征(fea...