本文共计2680字,预计阅读时长七分钟 聚类算法 一、本质 将数据划分到不同的类里,使相似的数据在同一类里,不相似的数据在不同类里 二、分类算法用来解决什么问题 文本聚类、图...

本文共计2680字,预计阅读时长七分钟 聚类算法 一、本质 将数据划分到不同的类里,使相似的数据在同一类里,不相似的数据在不同类里 二、分类算法用来解决什么问题 文本聚类、图...
本文共计2458字,预计阅读时长六分钟 HBase总结 一、本质 HBase是一个开源的非关系型分布式数据库(NoSQL),运行于HDFS文件系统之上,因此可以容错地存储海量...
本文共计2960字,预计阅读时长十分钟 推荐算法(一)--CB算法 一、推荐的本质 推荐分为非个性化和个性化,非个性化推荐比如各类榜单,而本系列主要介绍个性化推荐,即: 在合...
一句话表述 企业在市场中与用户、供应商、其他合作伙伴的关系,主要体现在 资金流 物流 信息流 三种类别 主体(具体产品或服务) 连接(连接用户与产品、服务) 系统(将用户与产...
一、MaxCompute是什么? MaxCompute(原ODPS,Open Data Processing Service)是一项大数据计算服务,它能提供快速、完全托管的P...
本文共计2584字,预计阅读时长二十分钟 神经网络与深度学习 前言 1.神经元的构成: 2.树突:神经元接收信号的部位,多个 3.轴突:神经元输出信号的部位,一个,但是在末端...
本文共计1234字,预计阅读时长八分钟 回归算法 一、回归的本质 发现y和x的规律,以预测新情况下的y值 二、回归算法的分类 1. 线性回归(Linear Regressio...
分类算法之决策树 一、原理 决策树是一种非参数的监督学习方法,它主要用于分类和回归。决策树的目的是构造一种模型,使之能够从样本数据的特征属性中,通过学习简单的决策规则——IF...
在数据开发的工作中,经常会遇到各种各样的问题,但往往又不是特别复杂的业务流程,如果用java处理起来总感觉显得有些笨重,这个时候我会更青睐python。 因为Pyth...
本文共1800字,预计阅读时长 10 min 一、数仓如何产生价值 当企业需要对不同来源、不同形式、不同主题的数据整合起来,供给数据分析、数据挖掘、数据报表使用时,有这么一个...
一、MaxCompute是什么? MaxCompute(原ODPS,Open Data Processing Service)是一项大数据计算服务,它能提供快速、完全托管的P...