机器学习系列(四) SVM算法的part2:SVM中的向量与空间距离

姓名:黄永飞;学号:17040520006;学院:机电工程学院;

转自:

http://blog.csdn.net/han_xiaoyang/article/details/52679559

【嵌牛导读】机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。在机器学习中,SVM这么神圣的算法可能是每个学习者会头痛却又不得不面对的,下面是SVM算法系列,进行详细讲解算法的使用和应用。

【嵌牛鼻子】SVM算法 向量 空间距离

【嵌牛提问】向量是什么?如何将一个向量映射到另一个向量上?如何计算间隔?

1.从向量到距离计算

SVM = Support Vector Machine,我们在Support Vector Machine中, 看到这个单词-vector(向量)。是的,SVM中的大量计算都是建立在向量基础上的,所以这篇做一个简短的知识回顾,会涉及到的内容包括:

向量是什么

    它的模长

    它的方向

如何加减向量

什么是点积

如何将一个向量映射到另一个向量上

超平面的方程是什么

如何计算间隔

1.1 什么是向量

如果我们在二维空间上定义一个点A (3,4),我们可以这样绘制它


定义:任意点x=(x1,x2),x≠0指定了平面上的一个向量,即从原点的开始到x点结束的向量。

下图是一个原点与A之间的向量。


这个点的起始位置是原点O(0,0),图中的这个向量是向量OA→。我们也可以找一个其他的字母标记来标识它,例如u。

注:你会发现我们写向量时,在向量上方有一个箭头,或者是将向量加粗。在这篇文章的剩余部分中,如果像OA→OA→这样由两个字母可以表示的,那么我将使用箭头来表示向量,否则的话将使用加粗字体的变量来表示向量。

现在我们知道有一个向量,但我们仍然不知道什么是一个向量。

定义:向量是一个既有大小又有方向的对象。

OK,所以这里涉及到两个概念:大小 和 方向。

1) 向量大小

一个向量x的大小写作∥x∥,称作向量的模。对我们的OA→来说,∥OA∥是线段OA的长度。


从图中我们可以很容易地使用勾股定理计算出距离OA:


2) 向量的方向

方向是向量的第二个组成部分。

定义:向量u(u1,u2)的方向是向量w(u1/u∥,u2/u∥)

那向量w的坐标怎么得到的?

要得到一个向量的方向,我们需要借助它的夹角.


上图展示了向量u(u1,u2),其中u1=3,u2=4。

简单的理解 : 向量uu的方向是由夹角θθ和夹角αα的余弦值决定的。

现在我们来观察一下角度的余弦值:


因此,这就是向量ww最初的定义,也就是为什么他的坐标被称作方向余弦。

计算方向向量

我们现在要计算上图向量u的方向。


向量u(3,4)的方向是向量w(0.6,0.8)。

下图是这个方向向量的一个示例:


我们可以看出w和u看起来一样,只是w的值小一点。并且w的模长为1,我们也把它称之为单位向量。

两个向量的和

有两个向量u(u1,u2)和v(v1,v2),那么:


这意味着两个向量相加形成了第三个向量,第三个向量的坐标是初始两个向量坐标的加和。下面是一个简单的图解:


两个向量的差

类似的,对于减法我们有:



由于减法是不可交换的,我们也应该考虑另一种情况:


向量内积

关于理解SVM的一个非常重要的概念就是内积(点积)。

定义:从几何学来说,它是两个向量的模长以及它们之间的夹角余弦值的乘积。

也就是意味着,如果我们有两个向量xx和yy,他们间的夹角为θθ,他们的内积是:


为什么内积这么算

为了便于理解,我们看一下这个问题的几何图形


在定义中我们写cos(θ),让我们看一下他到底是什么。

初中数学知识告诉我们,在一个直角三角形中:


OK,一个稍微复杂一点的图形,里面有两个向量,如下:



合在一起可以得到如下的几何图像:


可以看出:


θ=β−α所以计算cos(θ)cos(θ)就是在计算cos(β−α),根据两角差的余弦公式为:


(忘记这部分高中数学知识的同学请点击 公式推导)

直角三角形中三角函数的定义 =_=|



三角公式替换后有:


将∥x∥∥y∥左移有:


就这样推导了一遍向量内积的几何定义…

多说一句,当我们在谈论x⋅yx⋅y的点积是我们在谈论的是:

   向量X,Y的内积(线性代数)

   标量积,因为我们做两个向量的乘积,它返回一个标量(一个实数)。

向量的正交投影

有两个向量x与y,怎么求x在y上的正交投影?,如下图所示,将x投射到y上,得到向量z


通过定义:


我们从内积的部分有:


在方程中替换cos(θ)有:


如果我们定义了u作为y的方向那么:


现在我们可以用一种简单的方式定义z的模:

z与y有相同的方向向量u


所以我们说:

向量 z=(u⋅x)u 是向量 x在 y上的正交投影。

为什么要费尽心思去讲正交投影?因为它能帮助我们计算一个距离∥x−z∥。



2. SVM的超平面

我们都知道一条直线的数学方程是:y=ax+b,而超平面会被定义成类似的形式:


这两种形式是如何联系的?在超平面的方程可以看出,变量的名称是粗体的。是的,所以它们不是标量,是向量了。此外wTx是两个向量的内积。

还有一点大家注意一下,有时候我们会做一些形式变换,比如y=ax+b和y−ax−b=0其实是等价的。

两个向量,我们有


注意到w0是−b,这个值确定了与纵轴的交点。为什么我们用wTx这个方程式代表超平面而非y=ax+b呢?因为

   在多于二维的空间里,这个方程式更适用

   向量w垂直于超平面

计算一个点到超平面的距离第二个原因将派上用场。


2.1 计算点到超平面距离

下图中我们有一个超平面,他将两组数据划分开。


为了简化这个例子,我们干脆将w0设为0。

图中的超平面方程为:x2=−2x1相当于:


其中w(2,1),x(x1,x2)。请注意w是一个向量而非数据点。

我们来计算一下点A(3,4)到超平面的距离,下图是A投影到超平面的距离。


我们把点A视作一个从原点指向A的向量。再将A向量投影到向量w上


得到向量p


我们的目标是找到点A(3,4)和超平面之间的距离。从上图中可以很清楚看到这个距离就是∥p∥。让我们一起计算一下它的值:

向量w=(2,1)垂直于超平面,向量a=(3,4)


设向量 u为 w的方向向量


p是 a在 w上的投影,所以:


2.2 计算超平面的间隔

我们得出了A与超平面的距离∥p∥,根据间隔公式有:


是的,就这样算出了超平面的间隔!

3.总结

OK,到目前为止,其实就是简单回顾了一下向量中的一些概念,依旧用向量的知识,怎么帮助我们去计算超平面间隔,有兴趣的同学请接着看part3:如何找到最优分离超平面。

参考资料

SVM - Understanding the math

————————————————

版权声明:本文为CSDN博主「寒小阳」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/han_xiaoyang/article/details/52679559

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,185评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,652评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,524评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,339评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,387评论 6 391
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,287评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,130评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,985评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,420评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,617评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,779评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,477评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,088评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,716评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,857评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,876评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,700评论 2 354

推荐阅读更多精彩内容