信息推断,最大似然估计,和贝叶斯估计

一. 信息推断

我们经常会遇到一类问题:我们需要根据观察到的某个或多个现象推测出现象背后的原因或根源。例如古人的`一叶落知天下秋',就是看到落叶而推测出落叶背后的原因(秋天到了)。 在实际中,也会碰到很多这样的例子。

  • 你去菜市场挑西瓜,通过拍打西瓜的声音来判断是否熟了。
  • 爸爸妈妈通过观察婴儿的哭闹,来判断其是否饿了。
  • 医生通过对患者的询问、观察,检查结果来判断该患者的病情。
  • 你在荒野中迷路了,你通过观察太阳、星星、树木的形态等判断方向。
  • 审讯人员通过观察嫌犯的表情、手势,声音、眼神等,来判断他的心理活动。

当然,如果你熟悉科学的话,你会发现科学中的绝大部分探索,都是根据观察到的现象找到背后的原因的,例如

  • 牛顿通过观察到苹果垂直落到地面,因而发现了万有引力。
  • 沃森和克里克根据观察到的一张DNA清晰X射线衍射照片,推测出了DNA的双螺旋结构。
  • 德国物理学家普朗克为解释黑体辐射现象,提出了量子论,从而揭开了量子物理学的序幕。

这一类根据观察到的某个或多个现象推测出背后的原因或根源的问题,用个专业一点地词汇来说,叫做信息推断(Information inference)。

为什么我们需要信息推断?首先,隐藏在可以观察的现象的背后的原因可以给我们更多的信息,往往是我们最想要知道的。这上面的例子都属于这一类。其次,人看到一个现象就总想知道背后的原因。这一方面是出于人好奇的天性,总想知道为什么(这也促进了诸多学科的伟大发现),另外一部分的原因也是为了心安。因为一旦遇见一个自己没法解释的现象,人们就会丧失一些安全感,因此一定要找一个理由。例如古代人们刚看到日食时就大惊失色,因为超出自己的认知,于是找了一个原因:日食是由于天狗把太阳吃掉了。因而,每当日食发生时,人们总是纷纷鸣锣击鼓,呐喊狂呼,胁迫天狗吐出太阳,并且每次还都能成功。这个理由被人们验证之后,人们就心安了。

信息推断实际上是一个逆问题(inverse problem)。为什么这么说呢?因为事物一定是由本质产生现象,由原因产生结果。 例如西瓜的成熟度决定了它的声音,婴儿饥饿会导致其哭闹,患者所患的疾病会在他的身体的各项指标中显示出来等等。这些从本质到现象、从原因到结果的规律,叫做正问题见下图

正问题与逆问题

而信息推断恰好倒过来:根据现象找本质,根据结果找原因,因此被称为逆问题。

在遇到信息推断这类的逆问题时,我们通常的思考方式实际上可以分为两步:

  1. 列举所有可能的原因:有哪些原因可能会导致观察到这个现象?把这些原因一一列举出来。
  2. 选择:从这些可能的原因中选出一个,作为你判断的结果。

信息推断作为一个逆问题,要比`正问题'要难得多。这是为什么呢? 原因主要有两个:

  1. 有多个不同的原因可以产生该现象。例如你发现自己发烧,如果不做进一步检查找出新的证据的话,专业医生也很难判断出来你到底是流感、肺炎还是中耳炎、肠炎等等,因为这些病都可以导致发烧的症状。为什么会出现多个原因对应同一个现象?主要是因为观察到的现象的信息量太少,不具有排他性和区别性(在后文会详细解释)。
  2. 由于我们不具备相关知识或者有认知误区,导致该结果的原因根本就不在备选范围内。(例如古人看见日食,由于不具备天文学常识,因此想到的很多理由没有一个正确)。其实近现代的科学研究大多属于这一类:科学家观察到了某个现象,但是用现有的知识无法解释或者解释的不好,因此他们会提出能够解释或者解释的更好的理论,并做其他实验验证(即大胆假设,小心求证)。

在本文里,我们假设第二点的原因不存在,即真正原因已经包含在你列举出来的这些原因之中了。在这个假设前提下,我将会告诉你,基于当前观察到的证据或观测,如何思考,才有最大的概率选出隐藏在背后的真正原因。


二. 一般人在信息推断时的思考方式

我们先看一下,在思考信息推断这个逆问题的时候,一般人是如何思维的。人们通常的思考方式实际上可以分为三步:

  1. 列举所有可能的原因。
  2. 找出每一个原因产生该现象的可能性。
  3. 按照可能性大小排序,选择最有可能产生该现象的原因做为最终的结论。

注意第2步:从概率的角度来讲,有很多原因,都有可能产生你观察到的现象。但是每个原因产生该现象的概率是不同的。第3步中,人们往往选择那个产生该现象的概率最大的原因作为我们的选择。通俗的来讲,就是说找到能够解释当前的现象解释的最好的原因,作为我们的选择。科学家把这种思想,叫做最大似然估计。最大似然估计是大部分人脑海里根深蒂固的思考模式。

例子1: 挑西瓜

几乎每一个人都会挑西瓜。拍拍西瓜,放到耳边听一听,通过听到的声音来判断这个西瓜是否熟了。如果某一次你拍西瓜,发现听到的是`嘭嘭嘭'浑厚的声音,那么你的思考过程是什么样子的呢?

拍西瓜

在这个例子中,你拿到的现象就是拍打西瓜时你听到的`嘭嘭嘭'浑厚的声音。首先你会把所有的导致该声音的原因列举出来:(1)西瓜没熟,(2)西瓜刚好熟,(3)西瓜熟过了。

如果一个人有些挑西瓜的常识,他就能知道在通常情况下,如果是声音'咚咚咚'特别脆的声音,那么有很大的概率这个西瓜是没熟的;而'噗噗噗'特别闷的声音,很可能就熟过了;而'嘭嘭嘭'像拍打胸腔一样的浑厚声音则有很大的概率是一个好西瓜。

因此,当听到'嘭嘭嘭'浑厚的声音,绝大多数人会得出判断:这个西瓜正好!

作出这样的判断的思路如下:虽然三个原因 (西瓜没熟、西瓜刚好熟、西瓜熟过了)都有可能导致你听到 ‘嘭嘭嘭’ 浑厚的声音,但是相比于其他两个原因,`西瓜刚好熟'这个原因有更大的概率产生你听到的‘嘭嘭嘭’浑厚的声音。因此你作出了这个西瓜刚好熟的这个判断。

这个挑瓜的例子说明,当有多个原因都可以导致某个观察到的现象时,我们会思考每一个原因产生该现象的可能性,并且选择最容易产生产生该现象的原因作为最后的判断。这就是最大似然估计的思想。

例子2: 早餐,你喜欢吃什么

我的女儿有一本绘本故事,名字叫做“早餐,你喜欢吃什么”,其中有几段文字是这么写的:

  • 早餐,如果你喜欢吃鱼,那么,你可能是一只猫;
  • 早餐,如果你喜欢吃骨头,那么,你可能是一只狗;
  • 早餐,如果你喜欢吃胡萝卜,那么,你可能是一只兔子;
早餐,你喜欢吃什么

我们把这个例子用上面的思维方式来重新整理一下。我们拿`早餐你喜欢吃鱼'来举例,这是我观察到的现象,我想推断你是什么动物。

首先,列举出喜欢吃鱼的所有可能动物:猫、狗、兔子(还有很多,我们先假设这三个)。

其次,我们知道的是,这些吃鱼的动物中,他们喜欢吃鱼的可能性是多少。例如

  • 一只猫喜欢吃鱼的可能性有90%;
  • 一只狗喜欢吃鱼的可能性有70%;
  • 一只兔子喜欢吃鱼的可能性有1%

这样,但我们观察到你喜欢吃鱼这个现象的时候,我们一定选择最容易产生产生该现象的原因,即:你是一只猫。这也是最大似然估计。

例子 3: 坐飞机遇见剧烈颠簸

很多人害怕坐飞机,绝大多数人遇见飞机剧烈颠簸的时候都会非常紧张。他们脑子里实际上就开始做信息推断了。

坐飞机遇见剧烈颠簸

此时,`飞机剧烈颠簸'这是一个你观察到的事实。你会首先把可能导致该现象的所有原因列举出来。基本上导致飞机剧烈颠簸的原因有两个:

  1. 飞机出事了
  2. 飞机很安全,只是遇见气流而已。

大部分人紧张,是因为他们用了最大似然估计来进行选择。几乎所有人都知道(通过电影电视纪录片等),飞机出事的时候,一定会剧烈颠簸。因此第一个原因100%会产生观察到的现象。而飞机遇见气流时,并不一定会剧烈颠簸,因此第二个原因产生该现象的概率较第一个为低。也就是说'飞机出事了'能够更好解释你观察到的'飞机剧烈颠簸'这一现象。因此你自然就会得出`飞机出事了'这个结论, 当然会紧张。没错,大部分人就是这么思考的,所以大部分人都会紧张。

例子 4: 检查结果为阳性

我们大部分普通人,如果拿起一本医学书籍读过之后,都会在短期内有一种觉得这些症状和自己符合的感觉。 一名女士怀疑自己得了某种罕见的足以致命的血液疾病,希望在医院做一次检测。然而很不幸,测试结果为阳性。该检查仪器非常准确:检出率达到100%(只要得了这个血液病,那么一定可以通过该仪器测出来),并且误报率只有1%(100个健康人里只有一个误诊)。我的问题是,这位女士是否应该担心?

一个很精确的仪器检测出来了阳性,怎么办?

废话!如果仅仅是担心,那说明她心理素质算好的。心理素质差一点的人可能拿到结果就崩溃了!在本例子中,我们拿到的观察(现象)就是仪器检测出来是阳性这一事实。而产生这个事实的原因只能有两个

  1. 的确得病了。
  2. 没得病,是机器误诊。

显然,用最大似然估计的思路,第一个原因`得病了'会以100%的概率产生阳性的检查结果。而第二个原因,只会在1%的情况下产生阳性结果。因此判断的结果一定是患病了。

例子5: 学物理的,还是学经济的?

你在校园里遇见一个像下图顶部的图中这样衣着不整的学生,穿着拖鞋,邋里邋遢的样子。我问你,如果二选一的话,你觉得这个学生是学物理的还是学经济的?

对一个穿着不修边幅的学生的专业的估计(学物理的 or 学经济的?)爱因 斯坦和电影华尔街之狼中的小李子

我想大部分的人都会认为这个学生是学物理的吧。因为学物理的人给我们留下的印象是好比图中左下方的爱因斯坦,而学经济人给我们留下的印象,更接近于图中右下方的在电影华尔街之狼中风度翩翩的的小李子。

更严谨一点来说,当我们看到一个衣衫不整的学生后,由于我们的印象中‘学物理的'衣衫不整的概率要大于’学经济的'衣衫不整的概率,因此我们会认为这个人是一个学物理的。这也是用最大似然估计来进行判断。

用以上的这五个例子(1)挑西瓜(2) 早餐,你喜欢吃什么?(3)坐飞机遇见剧烈颠簸(4)检查结果为阳性(5)学物理的,还是学经济的?,我模拟了人们是如何用最大似然估计来思考并作出最后选择的。我想说的是,看这篇文章的你,很可能会和这五个例子中的人做出相同的选择。

你有没有想过,他们的思考方式,实际上是有问题的呢?我们将在下一章回答这个问题。


三. 加入本身的概率后的再思考

前一章的5个例子中我们用最大似然估计来进行信息推断,表面上看似合理,但是却犯了一个隐藏很深的重要错误。简单的说,用最大似然估计来思考问题没有考虑到不同的原因本身发生的概率是不同的。因此最大似然估计选择出来的一个原因,虽然可以很好的解释观察到的现象,但很可能其本身的概率极低。选择一个发生概率极低的现象,从数学上来说是不明智的。

用图解法来思考问题

我们用前一章中的几个例子为例,用图解法来详细说明用最大似然估计思考时犯的错误。

例子1 : 学物理的,还是学经济的?

用最大似然估计来思考时,当我们看到校园里一个人衣衫不整的时候,我们觉得他更有可能是学物理的,因为我们印象中,一个学物理的学生,比学经济的学生衣衫不整的概率要大得多。

可是,如果我事先告诉你这个学校根本完全是以经济为主,经济系的学生的数量是物理系的学生数量的10倍,那么你之前认为该学生是物理系的这个推论是否应该得到修正呢?

我们的直觉告诉我们,至少应该增加猜该学生是经济系的概率。那么具体增加多少呢?

我们用下图来形象的解释应该如何思考。这个图整体是一个正方形。该正方形由一小一大上下两个矩形构成。上方小矩形的面积代表该学校中学习物理的人数,下方大矩形的面积代表该学校学习经济的人数。由于学习经济的人数是学习物理的10倍,因此上下矩形的面积之比为1:10。

图解法解释检查结果为阳性的例子

为了量化我们印象中物理学家比经济学家衣衫不整的概率要大得多的这个事实,我们假设在学习物理的学生当中有75%的学生平常衣衫不整,而学习经济的学生中,只有15%的学生衣衫不整。衣衫不整的学生,我们用图中的蓝色部分来表示。也就是说,上方小矩形的蓝色面积,占整个小矩形的面积75%,下方大矩形的蓝色面积占整个大矩形的面积15%。

好了,我们现在观察到一个人是衣衫不整的,想知道到底是是学物理的概率大,还是学经济的概率大,我们如何计算?

我相信有的人已经找到方法了:因为我们观察到了这个人是衣衫不整的,因此我们只看蓝色的部分。我们可以将上下两个矩形的蓝色面积加起来,这个代表了所有衣衫不整的人的数量。上方小矩形的蓝色面积占整个蓝色面积的比例,就是衣衫不整的同学中,学物理的学生的比例!。我们来计算一下这个比例。不影响计算,我们假设上方小矩形面积为1,下方大矩形面积为10。因此

同理,上图中,下方大矩形的蓝色面积占整个蓝色面积的比例,就是衣衫不整的同学中学经济的学生的比例:

因此,尽管学物理的同学中衣着不整的概率达到了75%,远远高于学经济的同学中衣衫不整的概率的15%,但是由于学习物理的同学的数量远远小于后者,因此总体而言,我们更应当相信我们看到的这个衣衫不整的同学应该是学经济的。可以看出,如果我们将不同的原因本身发生的概率考虑进去之后,得到的结果很可能会和不考虑该因素得出的结果大相径庭。

其实,如果我们仅仅是想从'学习物理'和`学习经济'这两个原因选择一个的话,我们可以不需要通过分别求衣衫不整的人学经济的占比和衣衫不整的人学物理的占比。我们可以发现,上图中方小矩形的蓝色面积小于下方大矩形的蓝色面积,则意味着衣着不整的人中,学物理的要多于学经济的

例子2: 检查结果为阳性

同样,在`检查结果为阳性'的例子中,我们没有把这个病是一种罕见血液病的因素考虑进去。由于该病极其罕见,我们假设普通人中大概1000个人中才有1个患者。

我们用下图来说明在加入该信息之后应该如何做出选择。


图解法解释检查结果为阳性的例子

该图由一小一大上下两个矩形构成。上方小矩形代表得该病的患者数量,下方大矩形代表健康人的数量。根据前面所述图中上下矩形面积之比为1:999。我们假设上方小矩形面积为1,下方大矩形面积为999(不会影响计算)。在上半部分矩形中,蓝色面积表示检查出患者阳性的比例。由于患者检测为阳性的概率为100%,因此全部被阴影覆盖。而正常人检测为阳性的概率为1%,因此下半部分的蓝色面积占该矩形的面积的比例为1%。

好了,现在知道观察仪器检测结果为阳性,我们想判断到底是患该病概率大,还是仪器误诊的概率大。首先,我们可以先将上下两个矩形的蓝色面积加起来。其次,上方小矩形的蓝色面积占整个蓝色面积的比例,就是检测结果为阳性的人中病人的比例:

同样,而下方大矩形的阴影面积占整个阴影面积的比例,就是检测结果为阳性的人中健康人的比例:


可以看出,尽管真正的患者被机器检查出阳性的概率达到了100%,远远高于正常人被机器检查为阳性的1%,但是由于该种病极为罕见,因此总体而言,即使我们拿到了阳性检查结果,我们更应当相信是机器的误诊而不是真的患了病。

图解法对应的贝叶斯定理

上述图解法所对应的思想,可以用概率的方式更加严格的展现出来。我们将会说明,该图解法的思想,完全和信息推断中的贝叶斯定理符合。这部分内容有少量公式,但我已经尽量简化,相信具有高中数学基础的人应该能看得懂。

我们以学经济的还是学物理的例子而言。我们先定义两个随机变量,

  • X 代表专业,它可以取两个值:物理、经济。
  • Z 代表衣着,它可以取两个值:风度翩翩、衣衫不整。
用统计来代替概率

而现在当我们看到一个衣衫不整的人时,如果想要知道他是学习物理的概率,实际上就是要找到条件概率 P(X=物理|Z=衣衫不整)。注意,条件概率的定义:P(A|B)是B成立的情况下A发生的概率。

我们来用图解法来找到这个概率。这个条件概率,如果用统计上衣衫不整的人中学习物理的占比来近似,即

image.png

我们有了这个条件概率的表达式,但现在想将这个条件概率用另外一些概率表达出来。我们将这个条件概率的表达式稍微变换一下:


我们可以看出


这样 P(X=物理|Z=衣衫不整) 的表达式可以用这些概率来表示,显示在下图中。

把一个衣衫不整的人学习物理的概率,用刚才提到的多个概率来表示

我们可以看到,这个公式可以写成如下形式:

贝叶斯定理

这个,就是贝叶斯定理


本章总结

  1. 用图解法可以帮助我们把不同的原因本身发生的概率考虑进去。
  2. 如果我们将不同的原因本身发生的概率考虑进去之后,得到的结果很可能会和不考虑该因素得出的结果(即最大似然估计的结论)大相径庭。
  3. 用图解法中的面积的比例来代替概率,可以得到贝叶斯定理。

在下一章里,我们将会给出贝叶斯定理的解释,以及如何用贝叶斯定理来解决我们生活中的一些有趣的例子。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,194评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,058评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,780评论 0 346
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,388评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,430评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,764评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,907评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,679评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,122评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,459评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,605评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,270评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,867评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,734评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,961评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,297评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,472评论 2 348

推荐阅读更多精彩内容