登录注册写文章

支持向量机（一）——线性可分支持向量机导出

支持向量机（一）——线性可分支持向量机导出

〇、说明

支持向量机(Support Vector Machine,SVM)是监督学习中非常经典的算法。笔者主要参考学习的是李航老师《统计学习方法（第二版）》[1]和周志华老师的西瓜书《机器学习》[2]。

如有错误疏漏，烦请指正。如要转载，请联系笔者，hpfhepf@gmail.com。

一、问题描述

提前说明一下，为什么把看起来这么简单的东西，专门写一篇笔记，因为我觉得这个很重要，相当于理解支持向量机的一把钥匙，只有理解了支持向量机是怎么来的，才有可能理解后面更复杂的内容。

考虑一个二类问题。给定一个特征空间上的训练数据集

$T=\{(x_{1},y_{1}),(x_{2},y_{2}),…(x_{N},y_{N})\}$

其中， $x_{i}\in \mathcal X = \mathbb{R}^n$ ， $y_{i}\in \mathcal{Y}=\{+1,-1\}$ ， $i=1,2,\cdot \cdot \cdot ,N$ 。 $x_{i}$ 为第 $i$ 个特征向量，也称为实例， $y_{i}$ 为 $x_{i}$ 的类标记。当 $y_{i}=+1$ 时，称 $x_{i}$ 为正例；当 $y_{i}=-1$ 时，称 $x_{i}$ 为负例。 $(x_{i},y_{i})$ 称为样本点。

假设训练数据集是线性可分的。

学习的目标是在特征空间找到一个分类超平面，能将实例分到不同的类。分离超平面对应于方程 $w \cdot x+b=0$ ，它由法向量 $w$ 和截距 $b$ 决定，可用 $(w,b)$ 表示。分离超平面将特征空间划分为两部分，一部分是正类，一部分是负类。法向量指向的一侧为正类，另一侧为负类。

对于线性可分的训练数据集，存在无穷多个符合条件的分类超平面，那到底哪一个是最好的呢？

二、线性可分支持向量机

对于无穷多个分类超平面，直观上来说，位于两类样本中间的那个超平面可能就是最好的超平面，如图1中粗线条表示的分类超平面。

图1[2]

样本点 $x_{i}$ 到分类超平面 $(w,b)$ 的距离为 $r=\frac{1}{||w||} |w\cdot x_{i} +b|$ 。因此可以定义求取此最优超平面的问题为如下的最优化问题

优化问题一：

$\begin{split}&\mathop{max}\limits_{w,b} \quad & \gamma \\&s.t. & \frac{1}{||w||}(w\cdot x_{i}+b) \geq \gamma ,\ \ i=1,2,\dots,N\end{split} \tag{1}$

这样的优化问题比较直观，但不容易求解。

对于如上所述的训练数据集，我们可以构造分类超平面 $(w,b)$ ，使得

$\begin{cases} w\cdot x_{i}+b> 0, & \quad y_{i}=+1\\ w\cdot x_{i}+b</p><p>进一步，<img class=$

进一步， $\exists \varsigma >0$ ，使得

$\begin{cases} w\cdot x_{i}+b\geq \varsigma , & \quad y_{i}=+1\\ w\cdot x_{i}+b\leq -\varsigma , & \quad y_{i}=-1 \end{cases}\tag{3}$

这是推导过程中的关键一步，在周志华老师《机器学习》[2]书中的侧边栏给出，但不够清晰。

$(3)$ 式中，两个不等式两边同时除以 $\varsigma$ ，缩放后的系数仍然用 $w，b$ 表示，则有

$\begin{cases} w\cdot x_{i}+b\geq 1 , & \quad y_{i}=+1\\ w\cdot x_{i}+b\leq -1 , & \quad y_{i}=-1 \end{cases}\tag{4}$

如图2所示，距离超平面最近的几个训练样本使得 $(4)$ 式中等号成立，这些样本被称为“支持向量”。两个不同类的支持向量到分类超平面的距离之和为 $\gamma =\frac{2}{||w||}$ ，称之为“间隔”。

图2[2]

此时，优化问题一（式 $(1)$ ）等价于

优化问题二：

$\begin{split}&\mathop{max}\limits_{w,b} \quad & \frac{2}{||w||} \\&s.t. & y_{i}(w\cdot x_{i}+b) \geq 1,\ \ i=1,2,\dots,N\end{split} \tag{5}$

等价于

优化问题三：

$\begin{split}&\mathop{min}\limits_{w,b} \quad & \frac{1}{2} ||w||^2 \\&s.t. & y_{i}(w\cdot x_{i}+b) \geq 1,\ \ i=1,2,\dots,N\end{split} \tag{6}$

这是支持向量机的基本型。

求得优化问题三（式 $(6)$ ）的最优解 $(w^*,b^* )$ ，就得到最优分类超平面

$w^*\cdot x+b^* =0 \tag{7}$

对应的分类决策函数为

$f(x)=sign(w^* \cdot x +b^*) \tag{8}$

以上推导过程参考周志华老师《机器学习》的思路。李航老师《统计学习方法（第二版）》使用的是函数间隔和几何间隔的思路来推导的。

三、附录

A、参考

[1]、《统计学习方法（第二版）》，李航著，清华大学出版社

[2]、《机器学习》，周志华著，清华大学出版社

B、相关目录

[a]、支持向量机（一）——线性可分支持向量机导出

[b]、支持向量机（二）——线性可分支持向量机求解

[c]、支持向量机（三）——线性支持向量机

[d]、支持向量机（四）——核方法

[e]、支持向量机（五）——SMO算法

C、时间线

2020-05-27 第一次发布

2020-06-06 修改问题描述和图片来源

最后编辑于：2020.06.18 19:53:39

©著作权归作者所有,转载或内容合作请联系作者

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,968评论 6赞 482
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,601评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 153,220评论 0赞 344
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,416评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,425评论 5赞 374
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,144评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,432评论 3赞 401
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,088评论 0赞 261
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,586评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,028评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,137评论 1赞 334
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,783评论 4赞 324
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,343评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,333评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,559评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,595评论 2赞 355
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,901评论 2赞 345

1赞2赞

赞赏

手机看全文