《数据结构与算法》之树结构三(最优二叉树/哈夫曼树)

前言

Huffman Tree,有翻译成哈夫曼树,也有翻译成赫夫曼树的,其实都是一样的。哈夫曼树又称最优树,是一类带权路径长度最短的树。这里用最优二叉树来讨论。

最优二叉树(哈夫曼树)

上面说了“最优树是一类带权路径长度最短的树”。这里需要先了解三个概念:路径、路径长度、带权路径长度。

  • 路径
    两个结点之间的路线
  • 路径长度
    路径上的分指数就是路径长度
  • 带权路径长度
    • 结点的带权路径长度
      每个结点都有自己的权重,而结点的带权路径长度是指路径长度乘以目的结点的权重
    • 树的带权路径长度
      树中所有叶子结点的带权路径长度之和

假设现在有4个结点[A, B, C, D],它们组成的二叉树之中,树的带权路径长度最小的二叉树称为最优二叉树或者哈夫曼树。

哈夫曼树

上图的哈夫曼树的带权路径长度 = 2×3 + 4×3 + 5×2 + 7×1 = 35

构建哈夫曼树的一般算法如下:
1. 由给定的 n 个权值的结点去构建只有一个结点的二叉树,得到集合 F
2. 在 F 中选出权值最小和次小的树,它们分别作为左子树和右子树构建成一棵新的树,这个新的树的权值为它的左右孩子的权值之和
3. 从 F 中剔除选中的树,并将新的树放入 F
4. 重复步骤2、3,直到 F 中只剩一棵树,这棵树就是最优二叉树

哈夫曼编码

这是最优二叉树的一个经典应用,电报就应用了哈夫曼编码对报文进行了压缩、加密。

压缩报文

假设现在我们的所有对话可以用 A、B、C、D 涵盖,那么我们通过电报对话只需要约定好 A、B、C、D 的编码就好。我们通讯一般是用二进制串传输,称为二进制编码,那么我们应该如何给这四个字母定义编码呢?4转成二进制就是 100,显然如果每个字母对应的编码都是定长3的话,我们可以使用 0~3 的二进制来表示。

不过这里有个问题:我们说话时,每个字使用的频率是不同的,如果想要提高传输效率,那么要怎么压缩报文的长度呢?答案是将高频的字的编码设计得尽可能的短即可。不过这样就没有定长了,处理报文也变得麻烦了起来,要么就要增加结束标识(直接否掉,因为本来就是想尽量压缩报文,所以不想增加额外的标识);要么就需要任意一个编码不能是另一个编码的前缀

用上面的图作为例子,频率从高到低:A > B > C > D,可得以下表格

字母 编码
A 0
B 10
C 110
D 111
哈夫曼编码

对比表格和图,是不是发现节点的带权路径长度和我们的结点的哈夫曼编码一致呢?结合前面提到的哈夫曼算法理解:权重越大的结点越靠前(在这个例子中,权重等价于使用频率)。
因为我们要使用二进制编码传输,所以只有 0 和 1。

加解密

上面的表格又可以称之为“密码本”,因为它记录着我们约定好的编码对应的字是什么,所以没有它,是很难暴力破解的。至于解密,因为每个编码都具有唯一性(每一个编码都不会是另一个编码的前缀),所以用程序做比较也是十分简单的,匹配成功就转成文字即可。

总结

使用哈夫曼编码的好处:
1. 对于高频词汇可以用更少的位表示,报文体积更小,发送更快(压缩)
2. 使用它加密,暴力破解难度大(前提是不能泄漏密码本)
3. 解密容易
4. 当密码本泄漏以后,可以通过更换密码本的方式保护尚未泄漏的信息,而更换密码本的成本十分低(不用修改代码)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,366评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,521评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,689评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,925评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,942评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,727评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,447评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,349评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,820评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,990评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,127评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,812评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,471评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,017评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,142评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,388评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,066评论 2 355

推荐阅读更多精彩内容