在机器学习的学习过程,如果是用标记好的样例去学,去得到映射模型的话,称为监督学习。因为训练的集合样本是由监督者或者教师给出知识,比如标签。例如:给出一组猫的图片, 狗的图片,之后让机器学习模型去学习这些图片特征,训练的图片已经知道是猫还是狗,只需要找到规律得到模型,再给出一个猫或者狗的图片,让模型去判断是猫还是狗。再例如给出房屋的价格,给出地区信息,让机器学习模型学习,找到不同地区价格规律,再给出新的房屋地区属性,预测房屋价格信息。这种学习称为监督学习。并且这种类型的模型也叫做预测模型,因为这种模型给出的结果或者直接给出估计的目标变量,或者给出最可能的值的相关信息。
监督学习和预测模型,描述模型的关系如下 :
预测模型我们已经了解,是有训练集合,做训练,得到预测模型,再由这个模型去预测其他测试数据,得到结果。如图二所示。
但是描述模型不用训练集来得到模型,模型就是输出本身,就是我们要的结果。数据不分训练数据和测试数据。直接把所有数据输入,得到模型。如图三例如,把所有客户信息输入聚类算法,可以得到不同的有相似特征的客户群体,这就是聚类模型。可以针对不同客户群体做不同的销售方案。描述模型的问题是检测相对困难,不像预测模型那样可以直接评估结果是否正确。但是另一方面,描述模型的优势是可以发现伟大的新知识。所以经常用于机器学习和数据挖掘之间。