Jenson 不等式的笔记

最近看到 EM 算法,其中有用到琴生不等式,在这里做一个笔记。

凸函数和凹函数

在刚开始学习凸函数和凹函数的时候,我们会被凸函数和凹函数的命名所困扰,命名看起来是凹的,一些教材上却偏偏说它是凸函数。其实这个只是一个定义,它叫什么,并不影响函数本身的性质。就像我在 B 站上看到有些人戏称三国时期的武将赵云为“云妹”,你叫他“云姐”、“云妈”都不会改变赵云纯爷们的形象,你管于正叫“于妈”,他本质上还是个男的,你管范冰冰叫“范爷”,她也是个女的,也得嫁人是一个道理。因此大可不必为凸函数、凹函数的命名所纠结,应该结合凸函数、凹函数的性质来记忆。

例1:函数
y = \log x

的图像如下:

$y = \log x$ 函数图像

我们暂时先别纠结它叫什么。我们看这个函数有什么性质,和 Jensen 不等式又有什么关系。看图可知是增函数,这个函数的一阶导数 y\prime = \cfrac{1}{x} > 0 也说明了 y = \log x 是增函数。我们知道,导函数的增减性说明了函数的凹凸性,如果我们知道函数的凹凸性,就能够确定局部极值就是全局最优值。而导函数的增减性,就是二阶导数。我们可以画出各个点的切线,看看切线的斜率变化,就知道二阶导数的增减性了。很容易知道,切线的斜率是越来越小的,因此,导函数的导函数是减函数,从函数的表达式上也很容易验证。

y\prime\prime = -\cfrac{1}{x^2} > 0

那么 Jensen 不等式又说了什么呢?对于 Jensen 不等式的两点形式来说,就是图中任意两点的之间的部分都在这两点的割线的上方,即:

f(ta+(1-t)b) \ge tf(a) + (1-t)f(b)

因为概率分布的一个重要性质就是各个取值都介于 01 之间,并且它们的和为 1,因此 Jensen 不等式用概率、期望的语言解释就是:
f(E(X)) \ge E(f(x))

应用于多个点,即:

f(\sum_i^n \lambda_i x_i) \ge \sum_i^n \lambda_if(x_i)
其中 \lambda_i \ge0\sum_i^n \lambda_i = 1。把 f(x) = \log x 应用到上面的式子,得到:

\log(\sum_i^n \lambda_i x_i) \ge \sum_i^n \lambda_i\log(x_i)
其中 \lambda_i \ge0\sum_i^n \lambda_i = 1。这就是《统计学习方法》P159 脚注 1 的内容。我们看到这本书为了简化说明,没有给出凸函数和凹函数的描述,直接给出所需要的 Jensen 不等式的部分。

如何记忆 Jensen 不等式

针对于两点形式(多点形式可以依次推广),琴生不等式有两个方面:

1、凸函数任意两点的割线位于函数图形的上方 ;
2、凹函数任意两点的割线位于函数图像的下方。

我的记忆方法就是在稿纸上画图像。

凸函数和凹函数的比较

注意:不要纠结那两条黑的曲线叫凸函数还是凹函数。

凸函数:任意两点的割线位于函数图像的上方

这样的曲线满足的性质是:
1、切线的斜率逐渐增大;
2、函数的导函数是增函数;
3、函数的导函数的导函数大于 0
4、函数的二阶导数大于 0

因此,如果函数 f(x) 满足 f''(x) > 0,就有

\sum_i^n \lambda_i f(x_i) \ge f(\sum_i^n \lambda_ix_i)
其中 \lambda_i \ge0\sum_i^n \lambda_i = 1

凹函数:任意两点的割线位于函数图像的下方

这样的曲线满足的性质是:
1、切线的斜率逐渐减小;
2、函数的导函数是减函数;
3、函数的导函数的导函数小于 0
4、函数的二阶导数小于 0

因此,如果函数 f(x) 满足 f''(x) < 0,就有

f(\sum_i^n \lambda_ix_i) \ge \sum_i^n \lambda_i f(x_i)
其中 \lambda_i \ge0\sum_i^n \lambda_i = 1

(本节完)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,509评论 6 504
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,806评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,875评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,441评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,488评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,365评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,190评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,062评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,500评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,706评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,834评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,559评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,167评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,779评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,912评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,958评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,779评论 2 354

推荐阅读更多精彩内容

  • (参考百度百科) 导数定义: 设函数y=f(x)在点x0的某个邻域内有定义,当自变量x在x0处有增量Δx,(x0+...
    萍水相逢_程序员阅读 1,926评论 0 6
  • 这一节开始我们讨论非监督学习(Unsupervised Learning)的算法。在监督学习算法中,训练数据既包含...
    secondplayer阅读 4,850评论 1 2
  • 概率论与数理统计 无穷小阶数 无穷小量表述:线性逼近 相当于利用切线和斜率来理解误差和逼近。 泰勒级数:线性逼近 ...
    Babus阅读 809评论 0 1
  • 2017年,9.19日志 早上6点半起床,天居然还没有亮。想想应该是变天了,拉开窗,果真是下雨了。。 昨晚确定了本...
    蓝朵格格阅读 288评论 0 0
  • 雾霾又出现了,大家要多吃水果,喜欢户外跑步的也要做好保护措施,不开心啊~ 成都只要一下雨,就会立刻变身堵城,地铁瞬...
    图大人阅读 502评论 1 8