对于一个分类问题,其样本集中往往存在一些模糊不清的样本,直观上,考虑SVM分类器,这些样本往往处于超平面的附近。这些样本对于分类器的设计具有很大的影响。一种常用的方法为引入松弛因子到约束条件中,同时需要将这种松弛所导致的惩罚因子加入到目标函数中。
实际模型中,我们并不关心松弛因子,其数值是根据样本点到假设超平面的距离给出的,所以,我们只需要设定惩罚因子C的数值即可。C的值可以为固定的一个值,也可以是一个向量。这里可以引申出分类中不均衡的问题,即,样本中正分类和负分类的数量具有较大差异。这时我们可以通过引入两种惩罚因子C,人为的增加对较少样本数量类别的重视程度,进而改善不均衡问题。