机器学习中比较活跃的四大应用领域
数据挖掘
用机器学习方法,发现数据之间的关系
计算机视觉
用机器学习方法,让计算机像人一样看懂世界
自然语言处理
用机器学习方法,让计算机像人一样看懂文字
机器人决策
用机器学习方法,让计算机像人一样具有决策能力
例如:左转方向盘,右转方向盘,紧急制动等
数据挖掘案例:
一、回归问题
回归问题的主要内容:
1. 从一组数据出发,确定某些变量之间的定量关系式;即建立数学模型并估计未知参数。
2. 检验这些关系式的可信任程度。
3. 在多个自变量影响一个因变量的关系中,判断自变量的影响是否显著,将影响显著的选入模型中,剔除不显著的变量。
4. 利用所求的关系式对某一过程进行预测或控制。
案例1:根据一个人体检指标:求数学函数f(sex,age,protein,……,lymphocyte)=Blood Glucose;
此函数为连续型的多维概率密度函数,得到的是血糖的连续值。
二、分类问题
通过建立函数将样本离散化,实质就是回归问题的离散化结果。0
案例2:预测是否得了糖尿病
已知样本数据,求函数f(height,SNP1(基因系列),BMI分类,……,SNPSS)=whether a person has diabetes
三、什么是机器学习
根据已知的数据,学习出一个数学函数f(x1,x2,x3,x4,……)=y使其更能够有更强的预测能力。
四、专有名词概念
机器学习模型:f
Features(特征)
Label(标记)
样本、数据集
案例:计算机视觉分类
案例三:图像分类
输入图像->输出类别
已知:输入一些实例样本,给出标签:airplane,automobile,bird,cat……
求:一个机器学习模型f,使其实现上述功能。
案例四:目标检测
让机器检测出一张图片中所有的类别,并输出类别在图片中的位置信息(矩形块圈中物体)
案例五:语义分割
给出图片:一匹马,被完整的分割出来
本质上来讲仍是分类问题,即对每个像素点进行分类。
f([xi,yi])=y ([xi,yi])代表第i个像素点
案例六:场景理解
无人驾驶领域:
无人车根据学习结果识别场景区分可驾驶区域
案例七:文本分类
一篇新闻->输入->机器学习模型->输出->类别
案例8:自动生成文本摘要
一篇文章->输入->机器学习模型->输出->摘要
案例九:翻译
输入英文->输出中文
案例十:问答
Query+text->输入->输出->答案
案例十一:人机对话
微软小冰
案例十二:image to text
输入图片->输出描述性文字
案例十三:end to end级自动驾驶
传统无人驾驶:相机+雷达->3D建模->路径规划->产生控制信号(1.感知环境2.路径规划3.控制信号)
端到端:采集图像(大量)->机器学习模型(省略了3D建模和路径规划)->控制信号
案例十四:玩赛车游戏
用程序来控制赛车,让程序玩游戏而不是人玩,使其具有决策能力。
趋势:机器人与人打。
案例十五:机器人开门
机器人通过摄像头采集信息,输出控制信号
学习过程:通过成千上万次的仿真实验模拟这个过程,使得机器掌握开门的能力。
机器学习的分类:
1.传统的监督学习/深度学习:案例1、2
2.深度学习:自然语言处理所有案例,计算机视觉所有案例,end to end 级无人驾驶13
3.深度学习+强化学习:案例14,15
学习路线:1->2->3
循序渐进