一、机器学习定义
计算机程序从经验E中学习解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高。
例如:邮件系统从人工标记垃圾邮件中学习分类邮件。将邮件根据是否为垃圾邮件进行分类是任务T,人工进行的分类是经验E,最终邮件系统正确分类邮件的数量是性能度量P。
二、监督学习
给予算法一个包含正确答案的数据集,算法的目的是给出更多的正确答案。
回归问题:预测连续值输出。
分类问题:预测离散值输出。
三、无监督学习
给予算法的数据集中不包含正确答案,算法需要自己找出规律。
例如:各类聚类算法、鸡尾酒算法