如何理解条件概率?

我们来看一个例子,一个国家有三个省份,分别是F省,G省和H省,三个省份的土地面积分布是P(F),P(G)和P(H),每个省份分为城市和农村两个部分,现在国家派下调研员,调研这三个省份的城市化情况,他得到了关于三个省份城市农村数据表格(见表1),并根据表格画出了更形象的占比图(见图1)

表1 三个省份的城市农村数据

 

图1 三个省份城市农村占比图


调研员要计算城市化指标出来,以便评比三个省份的城市化率情况,他利用符号P(城市|省份)记录该省份的城市面积占比,等于城市面积P(省份,城市)除以省份面积P(省份),例如关于F省份的城市占比计算公式如下:

                                                                P(城市|F)=P(F,城市)/P(F)=50%

同理G省和H省的城市占比计算公式分别为:

                                                                 P(城市|G)=P(G,城市)/P(G)=40%

                                                                 P(城市|H)=P(H,城市)/P(H)=30%

调研员通过计算,得到城市化率排序为F省>G省>H省。这个时候,H省份觉得这种评比方式不合理,他把调研员的符号做了一下改变,把"|"符号两边调换了一下,即由P(城市|省份)更改为P(省份|城市),调研员问,这符号表示什么,H省的工作人员答复说,这表示在所有的城市中,某个省份的城市占比,计算公式为P(省份,城市)/P(城市)。三个省份的计算公式如下:

                                                               P(F|城市)=P(F,城市)/P(城市)≈27%

                                                                P(G|城市)=P(G,城市)/P(城市)≈32%

                                                                P(H|城市)=P(H,城市)/P(城市)≈41%

调研员使用H省工作人员推荐的公式一算,发现在这个指标下,H省排在了最前头。

为何只是调换一下,意思完全不同,而且结果也很大的不同?

我们来看一下调研员使用的记号P(城市|F),这表示F省份的城市占比,是F省份的城市占F省总面积的比例。城市可以是H省的城市,也可以是G省的城市,但是设定了F省份作为一个前提条件,那么只能用F省的城市做计算。这其实就是条件概率,条件概率是指事件A在另外一个事件B已经发生条件下的发生概率,换句话说,事件A发生的概率要考虑事件B的影响。我们再看看H省推荐的符号P(F|城市),前提条件变为了城市,即三个省份的城市面积之和,在这个前提条件下来讨论F省份城市占城市总面积之比。

为什么调换一下,结果完全不同,那是因为在不同条件下计算概率导致的,条件不同,概率值当然也不同。这在日常生活中能找到各种例子,例如我们都知道经济好坏对股市的影响很大,经济好的时候(股市上涨的概率和经济差的时候股市上涨的概率是不同的。有句话说,抛开剂量谈毒性也有条件概率的意思在里面,剂量是一个前提条件,必须得考虑前提条件才能谈毒性大小。

根据以上的例子,可以更抽象提出条件概率的严格定义:

定义:如果A和B是两个事件,且P(B)≠0。那么事件B条件下,事件A的条件概率为

                                                                            P(A|B)=P(A∩B)/P(B)

P(A∩B)表示A和B的交集,相当于双方的共同部分,在上例中,因为城市的面积包含在省份面积中,因此P(A∩B)就是城市的面积,其他P(A|B)和P(B)分别表示城市面积占比和省份面积。得到条件概率的公式,那就可以在公式上做做文章做更多的推论。

例如在公式两边都乘以P(B),得到推论1:

                                                                            P(A∩B)=P(A|B)P(B)

左边P(A∩B)是城市的面积,右边P(A|B)城市面积占比,P(B)省份面积。还可以通过另一个例子来理解,例如专家预测经济上行的概率为P(经济上行),专家根据往年的统计,在经济上行的时候,股市上涨的概率为P(股市涨|经济上行),套用公式,我们可以推出经济上行而且股市涨的概率

                                            P(股市涨∩经济上行)=P(股市涨|经济上行)×P(经济上行)

还有一个推论,我们知道,所有城市总面积是三个城市面积之和,计算公式如下:

                                                    P(城市)=P(F,城市)+P(G,城市)+P(H,城市)

我们再把推论1计算城市面积的公式套进去,得到:

                                            P(城市)=P(城市|F)P(F)+P(城市|G)P(G)+P(城市|H)P(H)      

这是通过已知的条件概率,来计算一个事件的概率的方法,这个推论是有前提条件的,只是在本例中这个前提条件看起来不那么明显,这个前提条件是三个省份不相关,或者互斥的,如果满足这个条件,我们可以得到更一般的推论公式:

推论2:有事件B1,B2,...,Bn,如果\bigcup_{i=1}^{n} Bi=\Omega (这表示所有事件B并起来等于整个样本空间,例如三个省份面积并起来等于这个国家的面积),并且两个不同事件互斥(BiBj=Φ, 如果i≠j,对应到例子中,各个省份没有交集),且任意P(Bi)>0。那么,对于任意事件A,有:

                                                                    P(A)=\sum_{i=1}^nP(A|Bi)P(Bi)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,496评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,407评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,632评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,180评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,198评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,165评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,052评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,910评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,324评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,542评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,711评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,424评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,017评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,668评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,823评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,722评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,611评论 2 353

推荐阅读更多精彩内容

  • 快三岁了,但还是粘乎乎,缠兮兮的。每次出门,都是眉眼低垂,哽咽抹泪,尤惹人怜。一开始,我如此安抚:闺女儿...
    叶矗子阅读 471评论 0 0
  • 文/静话心是 01. 青春是一束带刺的玫瑰 你只顾尽情欣赏她的芬芳浪漫 却忘了刺破手指的血也是一样鲜红 02 青春...
    静话心是阅读 6,968评论 6 17
  • NumPy 用字符编码来表示数据类型。如下表: 数据类型字符编码 整数i 无符号整数u 单精度浮点数f 双精度浮点...
    麒麟楚庄王阅读 317评论 0 0
  • 01 小杰是一名初中生,每年寒暑假的时候,他奉行的都是作业抛一边,玩乐应在先。整个假期十之八九的时间都玩得很嗨,眼...
    张若扬阅读 161评论 0 1