二叉堆

1. 思考

  • Top k 问题: 从海量数据中获取前k个 最大值最小值
    比如从 一百万 个整数中,获取最大的1000个整数;

  • 设计一种数据结构,用来存放整数元素,包括的操作是 获取最大值添加元素删除最大值

    各数据结构的时间复杂度对比

  • 为了能达到最优,使用
    :获取最大值时间复杂度O(1),添加元素时间复杂度O(log n),删除最大值时间复杂度O(log n);


2. 堆 (Heap)

  1. 这里的 是一种数据结构,不是指内存中,堆一般分为:
  • 二叉堆(Binary Heap,完全二叉堆);
  • 多叉堆(D-heap、D-ary Heap);
  • 索引堆(Index Heap);
  • 二项堆(Binomial Heap);
  • 斐波那契堆(Fibonacci Heap);
  • 左倾堆(Leftist Heap);
  • 斜堆(Skew Heap);
  1. 堆的最重要性质:任意节点的值总是 \geq 或者 \leq 子节点的值:
  • 如果任意节点的值 \geq 子节点的值,称为最大堆、大根堆、大顶堆;
  • 如果任意节点的值 \leq 子节点的值,称为最小堆、小根堆、小顶堆;

3. 二叉堆 (Binary Heap)

二叉堆 的数据结构是一棵完全二叉树,因此也被称为完全二叉堆;
鉴于二叉堆的结构,底层可以用 数组 实现;

最大二叉堆数据结构

  • 二叉堆的 索引 规律(从0开始,与数组对应)
  1. i = 0 , 表示根节点;
  2. i > 0 ,则父节点索引为floor( (i-1) / 2);
  3. 如果 2i + 1 <= n - 1, 它的左子树索引为 2i + 1 ;
  4. 如果 2*i + 1 > n - 1 ,该节点无左子树;
  5. 如果 2i + 2 <= n -1 ,该节点的右子节点索引为 2i + 2;
  6. 如果 2*i + 2 > n - 1,该节点无右子节点;
  • 二叉堆的接口设计
  1. int size(); \qquad //返回二叉堆元素个数;
  2. boolean isEmpty(); \qquad //判断是否为空;
  3. void clear(); \qquad //清空二叉堆;
  4. void add(E element); \qquad //添加元素;
  5. E get(); \qquad //获取堆顶元素;
  6. E remove(); \qquad //删除堆顶元素;
  7. E replace(E element); \qquad //替换堆顶元素

4. 二叉堆 获取最大值

获取堆顶,就能获取最大值

public E get() {
        emptyCheck();
        return elements[0];
    }

5. 二叉堆 添加元素

二叉堆添加元素(添加85)
  1. 如果node的值 > 父节点的值;
  • 与父节点交互位置
  1. 如果node的值 <= 父节点的值,或者node没有父节点;
  • 退出循环
  1. 这个过程叫做上滤(Sift Up)
  • 时间复杂度为 O( log n)
// 添加元素
public void add(E element) {
        elementNotNullCheck(element);
        ensureCapacity(size + 1);
        elements[size++] = element;
        siftUp(size - 1);
    }
// 上滤
private void siftUp(int index) {
        E e = elements[index];
        while (index > 0) {
            int pindex = (index - 1) >> 1;
            E p = elements[pindex];
            if (compare(e, p) <= 0) return;
            
            // 交换index、pindex位置的内容
            E tmp = elements[index];
            elements[index] = elements[pindex];
            elements[pindex] = tmp;
            
            // 重新赋值index
            index = pindex;
        }
        
    }

6. 二叉堆 删除最大值

二叉堆 删除元素(删除85)

堆是一种数据结构,只能删除 堆顶 元素,所以删除 最大值,不能删除其他位置的,参考栈结构。删除的操作如下:

  1. 将存放堆的数组最后一个元素,覆盖堆顶(node),然后将数组最后一个元素删除;
  2. 如果该节点(node)的值 < 最大子节点的值;
  • 将node与子节点交互位置;
  1. 如果该节点(node)的值 >= 最大子节点的值,或者已经没有子节点了;
  • 退出循环;
  1. 该过程称为下滤(Shit Down);
  • 时间复杂度为 O( log n)
// 删除堆顶
public E remove() {
        emptyCheck();
        
        int lastIndex = --size;
        E root = elements[0];
        elements[0] = elements[lastIndex];
        elements[lastIndex] = null;
        
        siftDown(0);
        return root;
    }

     // 下滤
    private void siftDown(int index) {
        E element = elements[index];
        int half = size >> 1;
        // half 为第一个叶子节点索引
        while (index < half) { 
            // index的节点有2种情况
            // 1.只有左子节点
            // 2.同时有左右子节点
            
            // 获取左子节点
            int childIndex = (index << 1) + 1;
            E child = elements[childIndex];
            
            // 获取右子节点
            int rightIndex = childIndex + 1;
            
            // 选出最大的子节点
            if (rightIndex < size && compare(elements[rightIndex], child) > 0) {
                child = elements[childIndex = rightIndex];
            }
            
            if (compare(element, child) >= 0) break;

            // 将子节点存放到index位置
            elements[index] = child;
            // 重新设置index
            index = childIndex;
        }
        elements[index] = element;
    }

6. 二叉堆 替换堆顶元素

替换(replace)和删除最大值一样,都是替换堆顶元素,然后判断是否大于 最大子节点,如果大于,那么进行 下滤,直到小于或者是叶子节点才退出循环;

public E replace(E element) {
        elementNotNullCheck(element);
        
        E root = null;
        if (size == 0) {
            elements[0] = element;
            size++;
        } else {
            root = elements[0];
            elements[0] = element; // 替换堆顶
            siftDown(0); //下滤
        }
        return root;
    }

7. 小顶堆的创建

以上所讲的都是大顶堆,小顶堆的创建非常简单,只要修改compare的函数就可以。

小顶堆

// 大顶堆的compare
public int compare(Integer o1, Integer o2) {
                return o1 - o2;
            }

// 小顶堆的compare
public int compare(Integer o1, Integer o2) {
                return o2 - o1;
            }

8. 应用

1. Top k 问题
  • 从n个整数/浮点数中,取出k个最大值,其中 k 远远小于 n;
  • 可以使用全排序进行来得出最大的k个值,但是时间复杂度为O( n log n);
  • 使用二叉堆,时间复杂度为 O( n log k);

步骤如下:

  1. 创建一个小顶堆;
  2. 遍历这n个值;
  • 先将 k 个值,添加到小顶堆中;
  • 从第k+1个值开始,先获取堆顶元素( heap.get() ),比较;
  • 如果大于堆顶元素,替换堆顶,进行下滤操作;
  • 如果小于等于堆顶元素,循环下一个元素;
  1. 遍历结束后,存放k个值的小顶堆,就是存放最大的k个值;
for (int i = 0; i < data.length; i++) {
            if (heap.size() < k) { // 前k个数添加到小顶堆
                heap.add(data[i]); 
            } else if (data[i] > heap.get()) { // 如果是第k + 1个数,并且大于堆顶元素
                heap.replace(data[i]); 
            }
        }
2. 优先级队列
  • 创建一个大顶推;
  • 设置队列节点的优先级权重;
  • 以权重来实现作为compare的判断条件;
  • 这样权重最大的节点,被放在堆顶,权重越小的就放在后面的节点;
  • 在执行队列时,会调用remove(),获取堆顶的节点,执行操作;
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,875评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,569评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,475评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,459评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,537评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,563评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,580评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,326评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,773评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,086评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,252评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,921评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,566评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,190评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,435评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,129评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,125评论 2 352

推荐阅读更多精彩内容