支持向量机(四)——核方法

〇、说明

支持向量机(Support Vector Machine,SVM)是监督学习中非常经典的算法。笔者主要参考学习的是李航老师《统计学习方法(第二版)》[1]和周志华老师的西瓜书《机器学习》[2]。

如有错误疏漏,烦请指正。如要转载,请联系笔者,hpfhepf@gmail.com。

一、问题引出

对于线性分类问题,前面所述的线性可分支持向量机和软间隔支持向量机是非常有效的方法。现实任务中,往往更多的是非线性的分类问题,线性模型就无能为力了。例如异或问题,如下图


图1[2]

这样的问题,可以考虑将样本从原始的特征空间映射到一个更高维的特征空间,使得样本在新的特征空间线性可分。在图1中,若将原始的二维空间映射到一个合适的三维空间,就能找到一个合适的分类超平面。如果原始的特征空间是有限维,那么一定存在一个高维特征空间使样本线性可分。[2]

利用核方法,可以将线性支持向量机扩展到非线性支持向量机。

二、核函数简介

李航老师在其《统计学习方法(第二版)》中对核函数有较为详细的介绍。这里简单介绍一下核函数的定义和常用核函数。

核函数定义[1]:

\mathcal X是输入空间(欧式空间\mathbb{R}^n的子集或离散集合),又设\mathcal H为特征空间(希尔伯特空间),如果存在一个从\mathcal X\mathcal H的映射

\phi (x):\mathcal X \rightarrow \mathcal H \tag{1}

使得对所有x,z\in \mathcal X,函数K(x,z)满足条件

K(x,z)=\phi(x) \cdot \phi(z) \tag{2}

则称K(x,z)为核函数,\phi(x)为映射函数。

正定核函数定义[1]:

\mathcal X\subset \mathbb{R}^nK(x,z)是定义在\mathcal X \times \mathcal X上的对称函数,如果对任意x_{i}\in \mathcal X, i=1,2,\dots,mK(x,z)对应的Gram矩阵

\textbf{K}=[K(x_{i},x_{j})]_{m\times m} \tag{3}

是半正定矩阵,则称K(x,z)是正定核函数。

用定义验证核函数并不容易,实际应用中往往使用已有的核函数。在使用中,通常只定义核函数,不用显式定义映射函数。

常用核函数:

1.线性核函数

K(x,z)=x\cdot z \tag{4}

就是内积。

2.多项式核函数[3]

K(x,z)=(x\cdot z+c)^d \tag{5}

c=0,d=1时,退化为线性核函数。

3.高斯核函数

K(x,z)=exp(-\frac{||x-z||^2}{2\sigma^2}) \tag{6}

也叫径向基核函数。

三、非线性支持向量机

在线性支持向量机[4]对偶问题的目标函数中,将样本内积x_{i} \cdot x_{j}替换成核函数K(x_{i},x_{j}),非线性支持向量机如下

\begin{split}&\mathop{min}\limits_{\alpha} \ &\frac{1}{2} \sum_{i=1}^N\sum_{j=1}^N \alpha_{i} \alpha_{j} y_{i} y_{j}K(x_{i} ,x_{j}) - \sum_{i=1}^N \alpha_{i} \\& s.t. & \sum_{i=1}^N \alpha_{i} y_{i}=0 \\&& 0\leq \alpha_{i} \leq C \ \ i=1,2,\dots,N\end{split} \tag{7}

求得最优非线性分类模型参数为

\begin{align}& w^*=\sum_{i=1}^N \alpha^*_{i}y_{i}x_{i} \\& b* =y^*_{j}-\sum_{i=1}^N \alpha^*_{i}y_{i}K(x_{i},x_{j}) , \ 0<\alpha^*_{j} <C \end{align}\tag{8}

决策函数为

f(x)=sign(\sum_{i=1}^N \alpha^*_{i} y_{i} K(x,x_{i}) +b^*) \tag{9}

四、附录

A、参考

[1]、《统计学习方法(第二版)》,李航著,清华大学出版社

[2]、《机器学习》,周志华著,清华大学出版社

[3]、Polynomial kernel

[4]、《支持向量机(三)——线性支持向量机》

B、相关目录

[a]、支持向量机(一)——线性可分支持向量机导出

[b]、支持向量机(二)——线性可分支持向量机求解

[c]、支持向量机(三)——线性支持向量机

[d]、支持向量机(四)——核方法

[e]、支持向量机(五)——SMO算法

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,126评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,254评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,445评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,185评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,178评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,970评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,276评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,927评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,400评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,883评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,997评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,646评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,213评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,204评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,423评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,423评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,722评论 2 345