【机器学习基础】核逻辑回归

将软间隔支持向量机看做正则化模型

上一小节中我们介绍了软间隔支持向量机，该模型允许有错分类数据的存在，从而使模型对数据有更好的适应性，有效避免过拟合的问题。
现在我们回顾一下松弛变量ξn，我们用ξn来记录违反分类边界的数据到边界的距离。

我们可以从另外一个角度，考虑一下ξn的计算：
对于任何一个点，如果该点违反了边界，那么ξn记录了其到边界的距离；如果没有违反，ξn为0。

所以我们可以用下面这个式子来表示：

与正则化模型的比较

在正则化中，我们用w的长度来控制复杂度，并且我们希望某个误差度量最小。所以对于软间隔支持向量机来说，你可以把它看成是这种正则化的一种形式。

那么我们为什么不从正则化的角度来介绍SVM呢？

原因：
首先如果以正则化的角度看待SVM，那么这就不能使用二次规划的方式来求解，这样就不能使用核技巧来解决对偶问题
其次，max(·,0)这个误差函数可能没有办法进行微分，比较难以求解

SVM和正则化

正则化做的事情是，其想让Ein变小，但是在其上使用w的长度作为控制的条件。
而硬间隔SVM是在把Ein当做是条件，要求模型一定要将数据正确的分开，并且希望w的长度越小越好。
如果看一般的L2正则化，则是如下的形式：

所以，最大间隔就是一个正则化的实现形式，它代表了可以找到较少的超平面。
参数C比较大的时候，对应比较小的λ，就代表了越小的正则化。

小结

我们已经介绍完了SVM，但是我们想将SVM延伸到其他问题上，比如逻辑回归的问题上，那么我们需要知道SVM和其他问题的关系，这样才能将它灵活的运用。

使用SVM来求解逻辑回归问题

第一步：比较SVM中误差函数和逻辑回归的交叉熵误差

下面我们将SVM中误差函数、逻辑回归的交叉熵误差和0/1误差画在同一图像中：

我们可以看出SVM中误差函数和逻辑回归的交叉熵误差都是0/1误差的上限函数，而且SVM的误差函数还是一个凸上限函数。
我们可以发现SVM中误差函数和逻辑回归的交叉熵误差是很相像的。
下面是这两个误差函数的比较：

于是，我们可以猜想，SVM相当于做L2正则化的逻辑回归问题。

第二步：用SVM做二元软分类来得到类别概率

根据上面的式子，我们首先使用SVM计算一个分数，得到w。然后再加上两个自由度，将这个分数乘上放缩因子A，加上平移因子B，这样比较符合逻辑回归中最大似然的需求。从几何意义上来讲，我们通过SVM计算得到分割线的法向量，然后再进行一些平移和放缩的微调，使之能更加吻合最大似然的要求。这是一个融合SVM和逻辑回归的方式。
如果SVM做的足够好的话，A的值应该大于0，而B的值应该很接近0。

下面是新的逻辑回归的式子：

这个式子第一阶段用SVM得到的一个分数，这个分数也可以看做是做完SVM后得到的一个特别的转换，相当于从多维转到一维的转换。
在第二阶段相当于求解的是单一维度的逻辑回归问题。

这个算法流程叙述如下：

这个方法是使用核SVM得到Z空间中的逻辑回归的近似解。

核逻辑回归

在SVM中，我们要解的是一个二次规划问题，然后可以到处对偶的式子，我们使用核技巧来求解高维向量的内积。
然而，在逻辑回归中，压根就不存在二次规划问题，那么我们该怎么去使用核技巧呢？
我们在计算中用到了w和z的内积，如果w可以表示成z的线性组合，当w和z求内积的时候，我们就可以用核技巧来计算z和z的内积了。

表示定理(Representer Theorem)

如果你求解的是L2-regularized的问题，那么一定有一个最好的w可以表示成z的线性组合：

如何来证明这件事情呢？
我们将w分成两个部分，分别为w的平行部分（由zn展开的那个空间的向量来构成）和w的垂直部分（与zn展开表示的向量垂直的向量）。
我们希望最后完全没有w的垂直部分。
将最优的那个w与zn相乘其实和w的平行部分和zn相乘得到的结果是一样的，因为w的垂直部分与zn相乘为0，所以得到的err是一样的。
对于最佳解wTw，其包含w的平行部分的平方和w的垂直部分的平方，如果使用反证法，假设w的垂直部分不是0，那么，wTw必将大于w的平行部分的平方，但是最小解wTw却比w的平行部分的平方还大，这与我们的假设是矛盾的，所以就证明了w的垂直部分为0。
这样就证明了w的最佳解可以被z线性表达。

通过上面的证明，我们知道只要是求解L2的线性模型，就可以使用核技巧。

将核技巧用于L2正则化的逻辑回归

我们先得到要求解的表达式，然后用zn和βn的线性组合的方式表示最佳的w，代入到原始的式子中，就可以通过求βn代替求w了。

这就得到了一个没有约束条件的最佳化问题，我们可以通过梯度下降的方法来求解βn。这就是核逻辑回归问题。

核逻辑回归的另一种解释

在之前的介绍中，我们将核逻辑回归看做是w的线性模型，这个w的线性模型作用于使用核技巧进行的转换之中的数据，还使用了L2正则项。
而另一种视角是，我们可以将K(xm,xn)当做是一种数据的转换，在转换后的数据(K(x1,xn),K(x2,xn),...,K(xN,xn))加以β的权重。
将前面一项写作矩阵形式βT* K *β可以看做是β和β的乘积，也相当于一种正则项。
这样核逻辑回归就可以看做是β的线性模型，作用于使用核函数转换之后的数据和一个核正则项。

转载请注明作者Jason Ding及其出处
GitCafe博客主页(http://jasonding1354.gitcafe.io/)
Github博客主页(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
简书主页(//www.greatytc.com/users/2bd9b48f6ea8/latest_articles)
百度搜索jasonding1354进入我的博客主页

最后编辑于：2017.11.27 02:24:13

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 212,332评论 6赞 493
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,508评论 3赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 157,812评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,607评论 1赞 284
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,728评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,919评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,071评论 3赞 410
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,802评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,256评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,576评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,712评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,389评论 4赞 332
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,032评论 3赞 316
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,798评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,026评论 1赞 266
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,473评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,606评论 2赞 350