从大数据中找到规律,通过可视化的角度呈现给人们。
用数据代替专家,用数据做决策。
经济驱动,数据变现 —— 大数据。
机器学习的典型引用:
经典案例——啤酒和纸尿裤的例子。
购物篮分析:关联规则
用户细分精准营销:聚类
垃圾邮件识别:朴素贝尔斯
信用卡欺诈:决策树
互联网广告:ctr预估,用户点击的可能性
自然语言处理:情感分析、实体识别
图像识别:深度学习
更多应用:
语音识别
个性化医疗
情感分析
人脸识别
自动驾驶
智慧机器人
私人虚拟助理
手势控制
视频内容识别
机器实时翻译
机器学习和数据分析的区别
数据特点:交易数据 vs 行为数据
交易数据:账单、订单
行为数据:浏览历史、搜索历史、点击历史、评论
少量数据 vs 海量数据
采样分析 vs 全量分析
解决业务问题不同
参与者不同
分析师:分析师能力决定结果
数据 + 算法:数据质量决定结果
目标用户:个体
机器学习算法分类1:
有监督学习:提前打好标签,这个邮件是不是垃圾邮件,分类算法、回归算法
无监督学习:聚类
半监督学习:走的次数越多,效果越好
分类算法2:
分类回归
聚类
标注
分类算法3:比较重要
生成模型:模棱两可,百分比
判别模型:非真即假
常见算法
ICDM
FP-Growth
逻辑回归
RF、GBDT
推荐算法
LDA
Word2Vector
HMM、CRF
深度学习