机器学习入门基础之模型篇----无监督学习和描述学习

在机器学习的学习过程，如果是用标记好的样例去学，去得到映射模型的话，称为监督学习。因为训练的集合样本是由监督者或者教师给出知识，比如标签。例如:给出一组猫的图片，狗的图片，之后让机器学习模型去学习这些图片特征，训练的图片已经知道是猫还是狗，只需要找到规律得到模型，再给出一个猫或者狗的图片，让模型去判断是猫还是狗。再例如给出房屋的价格，给出地区信息，让机器学习模型学习，找到不同地区价格规律，再给出新的房屋地区属性，预测房屋价格信息。这种学习称为监督学习。并且这种类型的模型也叫做预测模型，因为这种模型给出的结果或者直接给出估计的目标变量，或者给出最可能的值的相关信息。

监督学习和预测模型，描述模型的关系如下 :

图一

预测模型我们已经了解，是有训练集合，做训练，得到预测模型，再由这个模型去预测其他测试数据，得到结果。如图二所示。

图二

但是描述模型不用训练集来得到模型，模型就是输出本身，就是我们要的结果。数据不分训练数据和测试数据。直接把所有数据输入，得到模型。如图三例如，把所有客户信息输入聚类算法，可以得到不同的有相似特征的客户群体，这就是聚类模型。可以针对不同客户群体做不同的销售方案。描述模型的问题是检测相对困难，不像预测模型那样可以直接评估结果是否正确。但是另一方面，描述模型的优势是可以发现伟大的新知识。所以经常用于机器学习和数据挖掘之间。

图三

机器学习入门基础之模型篇----无监督学习和描述学习

推荐阅读更多精彩内容