支持向量机(一)——线性可分支持向量机导出

〇、说明

支持向量机(Support Vector Machine,SVM)是监督学习中非常经典的算法。笔者主要参考学习的是李航老师《统计学习方法(第二版)》[1]和周志华老师的西瓜书《机器学习》[2]。

如有错误疏漏,烦请指正。如要转载,请联系笔者,hpfhepf@gmail.com。

一、问题描述

提前说明一下,为什么把看起来这么简单的东西,专门写一篇笔记,因为我觉得这个很重要,相当于理解支持向量机的一把钥匙,只有理解了支持向量机是怎么来的,才有可能理解后面更复杂的内容。

考虑一个二类问题。给定一个特征空间上的训练数据集

 T=\{(x_{1},y_{1}),(x_{2},y_{2}),…(x_{N},y_{N})\}

其中,x_{i}\in \mathcal X = \mathbb{R}^ny_{i}\in \mathcal{Y}=\{+1,-1\}i=1,2,\cdot \cdot \cdot ,Nx_{i}为第i个特征向量,也称为实例,y_{i}x_{i}的类标记。当y_{i}=+1时,称x_{i}为正例;当y_{i}=-1时,称x_{i}为负例。(x_{i},y_{i})称为样本点。

假设训练数据集是线性可分的。

学习的目标是在特征空间找到一个分类超平面,能将实例分到不同的类。分离超平面对应于方程w \cdot x+b=0,它由法向量w和截距b决定,可用(w,b)表示。分离超平面将特征空间划分为两部分,一部分是正类,一部分是负类。法向量指向的一侧为正类,另一侧为负类。

对于线性可分的训练数据集,存在无穷多个符合条件的分类超平面,那到底哪一个是最好的呢?

二、线性可分支持向量机

对于无穷多个分类超平面,直观上来说,位于两类样本中间的那个超平面可能就是最好的超平面,如图1中粗线条表示的分类超平面。

图1[2]

样本点x_{i} 到分类超平面(w,b)的距离为r=\frac{1}{||w||} |w\cdot x_{i} +b|。因此可以定义求取此最优超平面的问题为如下的最优化问题

优化问题一:

\begin{split}&\mathop{max}\limits_{w,b}  \quad & \gamma \\&s.t. & \frac{1}{||w||}(w\cdot x_{i}+b) \geq \gamma ,\ \ i=1,2,\dots,N\end{split} \tag{1}

这样的优化问题比较直观,但不容易求解。

对于如上所述的训练数据集,我们可以构造分类超平面(w,b),使得

\begin{cases}    w\cdot x_{i}+b> 0,       & \quad y_{i}=+1\\    w\cdot x_{i}+b</p><p>进一步,<img class=

进一步,\exists \varsigma >0,使得

\begin{cases}    w\cdot x_{i}+b\geq \varsigma ,       & \quad y_{i}=+1\\    w\cdot x_{i}+b\leq -\varsigma ,       & \quad y_{i}=-1  \end{cases}\tag{3}

这是推导过程中的关键一步,在周志华老师《机器学习》[2]书中的侧边栏给出,但不够清晰。

(3)式中,两个不等式两边同时除以\varsigma ,缩放后的系数仍然用w,b表示,则有

\begin{cases}    w\cdot x_{i}+b\geq 1 ,       & \quad y_{i}=+1\\    w\cdot x_{i}+b\leq -1 ,       & \quad y_{i}=-1  \end{cases}\tag{4}

如图2所示,距离超平面最近的几个训练样本使得(4)式中等号成立,这些样本被称为“支持向量”。两个不同类的支持向量到分类超平面的距离之和为\gamma =\frac{2}{||w||} ,称之为“间隔”。

图2[2]

此时,优化问题一(式(1))等价于

优化问题二:

\begin{split}&\mathop{max}\limits_{w,b}  \quad & \frac{2}{||w||} \\&s.t. & y_{i}(w\cdot x_{i}+b) \geq 1,\ \ i=1,2,\dots,N\end{split} \tag{5}

等价于

优化问题三:

\begin{split}&\mathop{min}\limits_{w,b}  \quad & \frac{1}{2} ||w||^2 \\&s.t. & y_{i}(w\cdot x_{i}+b) \geq 1,\ \ i=1,2,\dots,N\end{split} \tag{6}

这是支持向量机的基本型

求得优化问题三(式(6))的最优解(w^*,b^* ),就得到最优分类超平面

w^*\cdot x+b^* =0 \tag{7}

 对应的分类决策函数为

f(x)=sign(w^* \cdot x +b^*) \tag{8}

以上推导过程参考周志华老师《机器学习》的思路。李航老师《统计学习方法(第二版)》使用的是函数间隔和几何间隔的思路来推导的。

三、附录

A、参考

[1]、《统计学习方法(第二版)》,李航著,清华大学出版社

[2]、《机器学习》,周志华著,清华大学出版社

B、相关目录

[a]、支持向量机(一)——线性可分支持向量机导出

[b]、支持向量机(二)——线性可分支持向量机求解

[c]、支持向量机(三)——线性支持向量机

[d]、支持向量机(四)——核方法

[e]、支持向量机(五)——SMO算法

C、时间线

2020-05-27 第一次发布

2020-06-06 修改问题描述和图片来源

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,968评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,601评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,220评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,416评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,425评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,144评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,432评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,088评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,586评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,028评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,137评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,783评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,343评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,333评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,559评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,595评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,901评论 2 345