Multiclass Classification
之前讨论的都是2个类别的分类问题,但是大部分其实都不是布尔分类,如何使用逻辑回归 (logistic regression) 来解决多类别分类问题是通过一个叫做"一对多" (one-vs-all)或者一对余 (one-vs-rest) 的分类算法来实现的
其原理很简单也很弱智,可以将数据集一分为二,为正类和负类,用一对多的分类思想 我们可以将其用在多类分类问题上。
比如有三个类别,我们就可以把它分成三个二元分类问题。
对于每一个类别,将其视为正类,将其他的所有类别视为负类,这样可以得到三个逻辑回归分类器,(因为分类器本来算的就是某种类别发生的概率,所以我们只需要关注这种类别,而将其他类别视为多余的(一对余)即可)
所以每种情况都会对应一个新的分类器,当有新的x值输入进的时候,我们需要将x带入三个分类器中,选择分类器h(x)
求得数据最大的那个值的那个分类器,就是可信度最高最好的。我们预测y(实际值)就是那个值。(因为h(x)的值相当于在给定x的情况下,出现在各分类的概率,最高的h(x)就是最有可能在这个类别。)