“一对一”,OvO: 产生N(N-1)个分类器,测试时,新样本提供给所有分类器,取结果中预测最多的类别作为最终结果
“一对多”,OvR: 产生N个分类器,在预测时,若只有一个分类器预测为正类,则对应的类别标记为最终分类结果。若有多个分类器预测为正例,则通常考虑各个分类器的预测置信度,选择置信度最大的类别标记作为分类结果。
"多对多',MvM: 每次将若干类作正例,剩余的作负例,不能随便划分,最常用的技术“ECOC” 纠错输出码;
OvO和OvR都是MvM的特例
编码:对N 个类别做M次划分,每次划分将一部分类别划为正例,一部分划为反例,训练M个分类器
解码:M个分类器分别对测试样本进行预测,这些预测标记组成一个编码,将这个预测编码与每个类别各自的编码进行比较,返回其中距离最小的类别作为最终预测结果。
详见西瓜书P65
编码矩阵: 二元码:正类,反类; 三元码:正类,反类,停用类
ECOC编码对分类器的错误有一定的容忍和修正能力,ECOC越长,纠错能力越强。
如果希望为一个样本同时预测出多个类别标记,这个任务就不再是多分类学习,而是“多标记学习”,这是机器学习领域,近年来相当活跃的一个研究领域。