人工智能通识-科普-信息增益-1

欢迎关注我的专栏( つ•̀ω•́)つ【人工智能通识】
【汇总】2019年4月专题


什么是条件熵?什么是信息增益?它的作用是什么?

条件熵Conditional entropy

如前面文章所说的,人工智能通识-科普-什么是熵熵是指系统的不确定性、随机性,这种性质是以系统输出的数据结果进行表现的,如硬币和骰子的统计数据,所以也可以看做数据的不确定性、随机性。

系统信息熵的计算公式是:

H(X)=-\sum _{x \in U }P(x)\log P(x)

但当我们获得更多消息的时候,系统的不确定性就会减少。

比如说这个问题,明天会下雨吗?假设我们有历史上每天是否下雨的1000条记录,其中100天下雨,900天不下,那么我们这个系统的信息熵可以计算:

\begin{align} H(是否下雨)&=-(\frac{1}{10}\times \log\frac{1}{10}+\frac{9}{10}\times \log\frac{9}{10})\\ &=-(0.1\times-3.3219-0.9\times 0.152)\\ &=0.3219+1.368\\ &=1.6899 \end{align}

但是,假如我们知道明天是否阴天。因为阴天经常会导致下雨,所以那么明天下雨的确定性就会上升,不确定性就会下降,熵就会减少。

H(是否下雨|已知是否阴天)

这个就是条件熵,即在某个条件下,数据变化的不确定性

条件熵的计算

仍然以下雨为例,比如上面1000天的数据中,200天是阴天的,800天使不阴天的(晴天),其中阴天情况下90天下雨,不阴天情况也有10天下雨(太阳雨 ฅ´ω`ฅ)。

那么已知阴天情况下,共200天,90天下雨,110天不下雨,是否下雨的条件熵是:

\begin{align} H(是否下雨|是否阴天=是)&=H(Y|X=Yes)\\ &=-(\frac{90}{200}\times \log\frac{90}{200}+\frac{110}{200}\times \log\frac{110}{200})\\ &=0.5184+0.4744\\ &=0.993\\ \end{align}

这个条件熵接近1,就是阴天且下雨的概率接近一半一半。

熵是1就是正反面一半一半,信息量是1比特就是可以消除50%的不确定性。

同样的,已知明天不阴天(晴天)的情况下,共800天,790天不下雨,10天下雨,这个条件熵是:

\begin{align} H(是否下雨|是否阴天=否)&=H(Y|X=No)\\ &=-(\frac{790}{800}\times \log\frac{790}{800}+\frac{10}{800}\times \log\frac{10}{800})\\ &=0.0179+0.079\\ &=0.0969\\ \end{align}

这个条件熵很低,确定性很高,晴天当然可以几乎确定是不下雨的。

如果熵为0,则说明绝对的确定。

但上面只是分开计算了阴天=是和阴天=否的情况,我们还要把它们按照概率比例相加一起才算是整个阴天与否条件下是否下雨的条件熵:

\begin{align} H(是否下雨|是否阴天)&=H(Y|X)\\ &=P(X=Yes)\times H(Y|X=Yes)+P(X=No)\times H(Y|X=No)\\ &=\frac{200}{1000}\times 1.6899+\frac{800}{1000}\times 0.969\\ &=0.1986+0.7752\\ &=0.9738 \\ \end{align}

近乎于1,也就是说,如果我们知道明天是否阴天,那么是否下雨也就基本确定了一半,这和200个阴天有90天下雨的感性认知基本一致。

总结上面我们计算方法,整体条件熵等于条件每个可能值的条件熵之概率加权和:

\begin{align} H(Y|X)=\sum_{x\in X}P(x)\log\frac{1}{P(x)} \end{align}

而每个可能值的条件熵,计算方法基本上和信息熵公式一致:

\begin{align} H(Y|X=A)=\sum_{y\in Y}P(Y|X=A)\log\frac{1}{P(Y|X=A)} \end{align}

信息增益Information Gain

信息增益是指某个信息条件下,系统整体的熵减少了多少,也就是整体信息熵减去条件信息熵的结果。

InformationGain(Y|X)=H(Y)-H(Y|X)

信息增益有什么用?

我们知道,世界上某个结果的出现往往是很多原因作用的结果,比如下雨这个事情就可能受到气温、气压、温度、湿度等等多种原因的影响。
但是,各种因素中哪一个因素对下雨影响最大?哪一些影响比较小?

如果我们也有1000天的气温、气压、温度、湿度数据,我们就可以计算出它们分别的条件熵,因为条件熵越大,那么就对结果的影响越大。

以上面的例子,是否阴天这个条件可以让是否下雨的不确定性下降1.6899-0.9738=0.7161,这个作用是非常明显的,相当于问你“明天有多大概率下雨?”和“明天如果阴天的话有多大概率下雨?”的差别。

下一篇我们将用更完整一些的案例来深化信息增益的计算方法和应用价值。


欢迎关注我的专栏( つ•̀ω•́)つ【人工智能通识】


每个人的智能新时代

如果您发现文章错误,请不吝留言指正;
如果您觉得有用,请点喜欢;
如果您觉得很有用,欢迎转载~


END

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,290评论 6 491
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,107评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,872评论 0 347
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,415评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,453评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,784评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,927评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,691评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,137评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,472评论 2 326
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,622评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,289评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,887评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,741评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,977评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,316评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,490评论 2 348

推荐阅读更多精彩内容