信息熵 Entropy --- 不确定性的单位

image.png

我们的生活在一个不确定性的世界,我们所接触的大量事件都不是绝对的,而是以某种概率存在。 比如,明天是否降雨,考试分数,回家的路上是否堵车,投资能否成功,等等。 测量,是科学的第一步。 为了科学的研究这个不确定的世界,我们首先就需要一个单位, 来衡量不确定性的大小。 我们在信息论中, 用熵(Entropy)作为不确定性的单位。

为了衡量一个事件的不确定性, 我们首先要用一个随机变量来代表一个随机事件X。 如果我们知道了 X的分布, 那么就可以利用X, 写出熵的定义。

H(X)=-\sum_{i=1}^{n} p_{i} \log _{b}(p_{i})

解释

  • H(X) : 随机事件X的熵。
  • p_{i} : 概率分布
  • b : 进制,它决定了熵的单位
    • 2: bit 比特 : (是的,就是我们常见的bit, 因为计算机用二进制)
    • e: nat 奈特
    • 10: ban
为什么是 p_{i} \log _{b} (p_{i}) 而不是\log _{b} (p_{i})

p_{i} 是概率分布,理论上取值为[0-1] , 但是, 当p_{i}=0 时,就会遇到 \log _{b} (0) 没有定义的问题。 我们知道:

\lim _{p \rightarrow 0^{+}} p \log (p)=0

所以, 加上 p_{i} 以后, 就可以保证 p_{i} \log _{b} (p_{i}) 在任何时候都成立。

例子

比如用 X 来代表我们投出一个硬币后, 硬币正面向上,还是反面向上这件事。 (这里我们使用2进制,即 b=2
(1)如果这个硬币是公平的硬币,p_{0} = p_{1} = 0.5 , 那么

H(X)= - [0.5 * log(0.5) + 0.5 * log(0.5) ] = 1

(2)如果这个硬币是不公平的硬币,p_{0} = 0.3 , p_{1} = 0.7 , 那么

H(X)= - [0.3 * log(0.3) + 0.7 * log(0.7) ] = 0.88

(3)如果这个硬币是不公平的硬币,p_{0} = 0.1 , p_{1} = 0.9 , 那么
H(X)= - [0.1 * log(0.1) + 0.9 * log(0.9) ] = 0.47

(4)如果这个硬币是不公平的硬币,p_{0} = 0 , p_{1} = 1 , 那么
H(X)= - [0 * log(0) + 1 * log(1) ] = 0

如果更密集的取点, 那么就可以画出来下面的图形 (p_{1} : Pr(X=1)):

均值分布时,熵最大
总结

(1) 当p_{0} = p_{1} = 0.5 时, 系统的不确定性最高。 如果一个人猜硬币正反面,这时他最没有把握。
(2) 当p_{0} = 0.1 , p_{1} = 0.9 时, 系统的不确定就相对比较高了, 对于猜硬币的人来说, 他就有比较大的把握。
(3) 当p_{0} = 0 , p_{1} = 1时, 熵为0,系统的不确定性完全消失。 熵为0的系统, 没有不确定性。

熵与信息

刚刚说,base=2 的熵的单位叫 bit , 我们经常接触的,信息的单位也是 bit。 这并不是巧合, 二者某种程度上说, 就是一个事物的一体两面。 这要从信息的本质说起:

信息是用来消除不确定性(熵)的, 消除1bit 的熵 ,需要1bit的信息。

用上面的例子来说, 当硬币正反几率相等的时候, 如果我们要知道答案,我们就需要1bit 的信息。 而当p_{0} = 0 , p_{1} = 1时, 熵为0, 我们不需要任何信息, 就可以知道答案。

热力学的熵 与 信息熵

我们刚才说的熵, 是信息熵, 而在热力学中 ,也有熵的概念, 二者都是用来描述系统混乱程度的。 本文开头的图片中, 左边杯子中的水, 以冰的的形式存在, 在杯子里面并不是均匀分布的, 此时熵比较低, 对应到信息熵, 我们可以说, 此时,我们更容易判断某个水分子在杯子中的位置。 而右边杯子中, 冰已经化成水, 水分子的活动空间增加, 水分子在杯子中分布更加均匀, 此时的熵也就要更高。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,386评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,142评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,704评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,702评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,716评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,573评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,314评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,230评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,680评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,873评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,991评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,706评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,329评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,910评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,038评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,158评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,941评论 2 355

推荐阅读更多精彩内容