数据机构与算法--索引优先队列

数据机构与算法--索引优先队列

图片来自nullzx的博客园

索引优先队列,用一个索引数组保存了元素在数组中的位置。在插入队列中时,可看作将一个整数和一个对象相关联,使得我们可以引用队列中的元素。比如在Dijkstra算法中就用到了索引优先队列,他将顶点(整数表示)和源点到该顶点的最短路径长度关联起来,每次删除最小元素,都能得到与之关联的那个整数;如果该整数已经被关联了,还可以更新与该整数关联的对象。可以看出,索引优先队列和优先队列比起来,操作数组里面的元素更加方便了——这就是关联了索引带来的好处。

我们使用Key[] keys保存对象,int[] pq保存对象在数组中的位置,比如pq[1] = 5,那么keys[pq[1]] = keys[5]表示整数5和对象关联,而这个整数5存放于pq索引为1的位置;用一个int[] qp保存pq的逆序,即如果pq[i] = j(表示数组pq索引为i的位置存放了一个被关联的整数j),则有qp[j] = i,因此qp保存的是被关联整数j在数组pq中的索引。易知pq[qp[j]] = j; qp[pq[i]] = i

要注意的是,pq数组存放的关联整数是连续的,而qp和keys数组中存放的元素不是连续的,他们的位置是一一对应的。如果整数i还没有被关联,总是令qp[i] = -1,因此对应地keys[i] = null

自始至终keys数组中的元素位置不会发生变化,这就是说所有上浮下沉操作后,keys中元素的相对位置都不会变化,变化的只是与之关联的索引pq还有qp而已。(反正都能通过pq数组中存放的关联整数快速找到keys数组中的元素,所以只改变pq和qp中元素的相对位置足矣)

image

下图是将与整数3关联的对象替换成“a”.

image

这是一个小顶堆,pq是优先队列,但是它优先级的顺序并不是按照其关联的整数来排列的,而是按照关联整数对应的对象的大小来排列,即keys[pq[i]]。因此可以写出用于比较两个元素的less或者greater方法,我们先实现基于小顶堆的索引优先队列,它可以快速找到或者删除最大元素,所以greater方法如下

private boolean greater(int i, int j) {
    return keys[pq[i]].compareTo(keys[pq[j]]) > 0;
}

可以删除最小元素的IndexMinPQ

我们的所有关键方法几乎都以greater方法为基础,理解它尤为重要。以下是完整实现。

package Chap9;

import java.util.Arrays;
import java.util.NoSuchElementException;

public class IndexMinPQ<Key extends Comparable<Key>> {
    private int N;
    private int[] pq; // 索引二叉堆,按照惯例从1开始
    private int[] qp; // 逆序,满足qp[pq[i]] = pq[qp[i]] = i
    private Key[] keys;

    public IndexMinPQ(int maxN) {
        // 可存放范围为[0, maxN]
        keys = (Key[]) new Comparable[maxN + 1];
        // 索引二叉堆,存放范围为[1, maxN]
        pq = new int[maxN + 1];
        // 可存放范围为[0, maxN]
        qp = new int[maxN + 1];
        // 刚开始没有关联任何整数,都设置为-1
        Arrays.fill(qp, -1);
    }

    // 针对是pq中的索引i、j,但是实际引用的是keys中对应的元素
    private boolean greater(int i, int j) {
        return keys[pq[i]].compareTo(keys[pq[j]]) > 0;
    }

    public boolean isEmpty() {
        return N == 0;
    }

    public int size() {
        return N;
    }

    public boolean contains(int k) {
        return qp[k] != -1;
    }

    public void insert(int k, Key key) {
        if (!contains(k)) {
            N++;
            pq[N] = k;
            qp[k] = N;
            keys[k] = key;
            swim(N);
        }
    }

    // 给整数k重新关联一个对象
    public void replace(int k, Key key) {
        keys[k] = key;
        // 由于和k关联的新key可能大于原来的key(此时需要下沉),也有可能小于原来的key(此时需要上浮),为了简化代码,既上浮又下沉,就囊括了这两种可能。
        swim(qp[k]);
        sink(qp[k]);
    }

    // 返回最小元素
    public Key min() {
        return keys[pq[1]];
    }

    // 最小元素的关联整数
    public int minIndex() {
        return pq[1];
    }

    public int delMin() {
        if (isEmpty()) {
            throw new NoSuchElementException("队列已经为空,不能执行删除!");
        }
        int indexOfMin = pq[1];
        // 堆顶和最后一个元素交换
        swap(1, N--);
        sink(1);
        // 最后一个元素置为空
        keys[indexOfMin] = null;
        // 同时关联整数pq[N]在pq中的的索引设置为-1,表示还没有对象与该整数关联
        qp[indexOfMin] = -1;

        return indexOfMin;
    }

    public void delete(int k) {
        if (!contains(k)) {
            throw new NoSuchElementException("没有元素与" + k + "关联!");
        }
        // index为整数k在pq中的位置
        int index = qp[k];

        swap(index, N--);
        // 这里一定要先上浮下沉后再将元素置空,因为swim方法没有N的限制,在没有交换元素的情况下,即删除的就是pq中最后一个元素,如果先置空, 会在greater方法中引发空指针
        // 而sink方法有N的限制,先置空后置空都没有影响,2k <= N会限制它进入循环,避免了空指针
        swim(index);
        sink(index);
        keys[k] = null;
        qp[k] = -1;
    }

    public Key keyOf(int k) {
        if (contains(k)) {
            return keys[k];
        }
        // 没有与k关联就返回null
        return null;
    }

    private void swap(int i, int j) {
        int temp = pq[i];
        pq[i] = pq[j];
        pq[j] = temp;
        // 还要更新qp
        qp[pq[i]] = i;
        qp[pq[j]] = j;
    }

    private void swim(int k) {
        // k = 1说明当前元素浮到了根结点,它没有父结点可以比较,也不能上浮了,所以k <= 1时候推出循环
        while (k > 1 && greater(k / 2, k)) {
            swap(k / 2, k);
            // 上浮后,成为父结点,所以下标变成原父结点
            k = k / 2;
        }
    }

    private void sink(int k) {
        // 父结点的位置k最大值为 N/2,若k有左子结点无右子结点,那么2k = N;若两个子结点都有,那么2k + 1 = N
        // 有可能位置k只有左子结点,依然要比较,用2k + 1 <= N这个的条件不会执行比较,所以用2k <= N条件
        while (2 * k <= N) {
            int j = 2 * k;
            // 可以取j = N -1,greater(N -1, N);由于下标从1开始,所以pq[N]是有元素的
            if (j < N && greater(j, j + 1)) {
                // 右子结点比左子结点大 ,取右子结点的下标
                j++;
            }
            // 左子结点或者右子结点和父结点比较
            // 如果pq[k] >= pq[j],即父结点大于等于较大子结点时,停止下沉
            if (!greater(k, j)) {
                break;
            }
            // 否则交换
            swap(k, j);
            // 下沉后,下标变成与之交换的元素下标
            k = j;
        }
    }

    public static void main(String[] args) {
        IndexMinPQ<String> indexMinPQ = new IndexMinPQ<>(20);
        indexMinPQ.insert(5, "E");
        indexMinPQ.insert(7, "G");
        indexMinPQ.insert(2, "B");
        indexMinPQ.insert(1, "A");
        if (indexMinPQ.contains(7)) {
            indexMinPQ.replace(7, "Z");
        }

        System.out.println(indexMinPQ.min()); // A
        System.out.println(indexMinPQ.delMin()); // 1
        System.out.println(indexMinPQ.delMin());// 2
        System.out.println(indexMinPQ.minIndex()); // 5
        System.out.println(indexMinPQ.keyOf(7)); // Z
        indexMinPQ.delete(7);

    }
}

swap方法不仅交换了pq中的元素——即关联的整数,也要同时更新qp,保持qp[pq[i]] = i这样的关系。swim和sink方法没有改变,要熟知这两个方法操作的是二叉堆pq,而pq中关联的整数映射着真正的数据元素。因此pq[1]存放的是和最小元素关联的整数,通过keys[pq[1]]就可以返回最小元素。这句话解释了minminIndex方法的实现。

我们来看insert方法,先判断要关联的整数k是不是已经被关联了,没有关联时才能进行下面的操作,和优先队列一样,在二叉堆pq的末尾插入,同时qp数组也要赋值,然后在keys中的关联整数k处存入元素,最后上浮操作恢复堆有序状态;如果整数k已经被关联,即replace方法,用一个新的对象和这个整数关联,这里注意,由于和k关联的新key可能大于原来的key(此时需要下沉),也有可能小于原来的key(此时需要上浮),为了简化代码,既上浮又下沉,就囊括了这两种可能。

delete方法,先找到关联整数k在pq中的位置,然后将其与最后一个交换位置,同时N减去1。之后对换过去的元素作上浮下沉操作,然后才在keys中将k位置的元素置空,一定要先上浮下沉后才置空,因为swim方法没有N的限制,在没有交换元素的情况下,即删除的就是pq中最后一个元素,如果先置空, 会在greater方法中引发空指针

delMin方法删除最小元素同时返回与之关联的整数。最小元素位于堆顶即pq[1],这个值就是最小元素关联的整数。之后删除最小元素的操作就和delete类似了,将最小元素的索引pq[1]和最后一个元素交换,然后下沉(在堆顶无需上浮)恢复堆有序状态。

keyOf(int k)返回与整数k关联的元素。

各个方法在最坏情况下的时间复杂度如下所示

image

可以删除最大元素的IndexMaxPQ

IndexMaxPQ的实现可以通过简单修改IndexMinPQ得到。将greater方法改成less,然后实现中所有greater方法替换成less即可

private boolean less(int i, int j) {
    return keys[pq[i]].compareTo(keys[pq[j]]) < 0;
}

实现如下

package Chap9;

import java.util.Arrays;
import java.util.NoSuchElementException;

public class IndexMaxPQ<Key extends Comparable<Key>> {

    private int N;
    private int[] pq; // 索引二叉堆,按照惯例从1开始
    private int[] qp; // 逆序,满足qp[pq[i]] = pq[qp[i]] = i
    private Key[] keys;

    public IndexMaxPQ(int maxN) {
        // 可存放范围为[0, maxN]
        keys = (Key[]) new Comparable[maxN + 1];
        // 索引二叉堆,存放范围为[1, maxN]
        pq = new int[maxN + 1];
        // 可存放范围为[0, maxN]
        qp = new int[maxN + 1];
        // 刚开始没有关联任何整数,都设置为-1
        Arrays.fill(qp, -1);
    }

    // 针对是pq中的索引i、j,但是实际引用的是keys中对应的元素
    private boolean less(int i, int j) {
        return keys[pq[i]].compareTo(keys[pq[j]]) < 0;
    }

    public boolean isEmpty() {
        return N == 0;
    }

    public int size() {
        return N;
    }

    public boolean contains(int k) {
        return qp[k] != -1;
    }

    public void insert(int k, Key key) {
        if (!contains(k)) {
            N++;
            pq[N] = k;
            qp[k] = N;
            keys[k] = key;
            swim(N);
        }
    }

    // 给整数k重新关联一个对象
    public void replace(int k, Key key) {
        keys[k] = key;
        // 由于和k关联的新key可能大于原来的key(此时需要下沉),也有可能小于原来的key(此时需要上浮),为了简化代码,既上浮又下沉,就囊括了这两种可能。
        swim(qp[k]);
        sink(qp[k]);
    }

    // 返回最小元素
    public Key max() {
        return keys[pq[1]];
    }

    // 最小元素的关联整数
    public int maxIndex() {
        return pq[1];
    }

    public int delMax() {
        if (isEmpty()) {
            throw new NoSuchElementException("队列已经为空,不能执行删除!");
        }
        int indexOfMax = pq[1];
        // 堆顶和最后一个元素交换
        swap(1, N--);
        sink(1);
        // 最后一个元素置为空
        keys[indexOfMax] = null;
        // 同时关联整数pq[N]在pq中的的索引设置为-1,表示还没有对象与该整数关联
        qp[indexOfMax] = -1;

        return indexOfMax;
    }

    public void delete(int k) {
        if (!contains(k)) {
            throw new NoSuchElementException("没有元素与" + k + "关联!");
        }
        // index为整数k在pq中的位置
        int index = qp[k];

        swap(index, N--);
        // 这里一定要先上浮下沉后再将元素置空,因为swim方法没有N的限制,在没有交换元素的情况下,即删除的就是pq中最后一个元素,如果先置空, 会在greater方法中引发空指针
        // 而sink方法有N的限制,先置空后置空都没有影响,2k <= N会限制它进入循环,避免了空指针
        swim(index);
        sink(index);
        keys[k] = null;
        qp[k] = -1;
    }

    public Key keyOf(int k) {
        if (contains(k)) {
            return keys[k];
        }
        // 没有与k关联就返回null
        return null;
    }

    private void swap(int i, int j) {
        int temp = pq[i];
        pq[i] = pq[j];
        pq[j] = temp;
        // 还要更新qp
        qp[pq[i]] = i;
        qp[pq[j]] = j;
    }

    private void swim(int k) {
        // k = 1说明当前元素浮到了根结点,它没有父结点可以比较,也不能上浮了,所以k <= 1时候推出循环
        while (k > 1 && less(k / 2, k)) {
            swap(k / 2, k);
            // 上浮后,成为父结点,所以下标变成原父结点
            k = k / 2;
        }
    }

    private void sink(int k) {
        // 父结点的位置k最大值为 N/2,若k有左子结点无右子结点,那么2k = N;若两个子结点都有,那么2k + 1 = N
        // 有可能位置k只有左子结点,依然要比较,用2k + 1 <= N这个的条件不会执行比较,所以用2k <= N条件
        while (2 * k <= N) {
            int j = 2 * k;
            // 可以取j = N -1,greater(N -1, N);由于下标从1开始,所以pq[N]是有元素的
            if (j < N && less(j, j + 1)) {
                // 右子结点比左子结点大 ,取右子结点的下标
                j++;
            }
            // 左子结点或者右子结点和父结点比较
            // 如果pq[k] >= pq[j],即父结点大于等于较大子结点时,停止下沉
            if (!less(k, j)) {
                break;
            }
            // 否则交换
            swap(k, j);
            // 下沉后,下标变成与之交换的元素下标
            k = j;
        }
    }

    public static void main(String[] args) {
        IndexMaxPQ<String> indexMaxPQ = new IndexMaxPQ<>(20);
        indexMaxPQ.insert(5, "E");
        indexMaxPQ.insert(7, "G");
        indexMaxPQ.insert(2, "B");
        indexMaxPQ.insert(1, "A");
        if (indexMaxPQ.contains(7)) {
            indexMaxPQ.replace(7, "Z");
        }

        System.out.println(indexMaxPQ.max()); // Z
        System.out.println(indexMaxPQ.delMax()); // 7
        System.out.println(indexMaxPQ.delMax());// 5
        System.out.println(indexMaxPQ.maxIndex()); // 2
        System.out.println(indexMaxPQ.keyOf(1)); // A
        indexMaxPQ.delete(1);

    }
}

使用优先队列的多项归并

下面的例子使用IndexMinPQ解决了多向归并的问题:它将多个已经有序的输入流归并成一个有序的输出流。无论输入流有多长,都可以将其全部读入并排序(并不是一次性读入内存的,我们将看到任何时刻队列中只存在每个输入流的一个元素而已)

package Chap9;

import java.io.ByteArrayInputStream;
import java.io.IOException;
import java.io.InputStream;

public class Multiway {
    public static void merge(InputStream[] streams) throws IOException {
        int N = streams.length;
        // 为每个输入流关联一个整数
        IndexMinPQ<String> pq = new IndexMinPQ<>(N);
        // 从每个流中读取一个字符,因为每个流都已经有序,所以其中必然有最小元素
        for (int i = 0; i < N; i++) {
            int ch;
            if ((ch=streams[i].read()) != -1) {
                pq.insert(i, String.valueOf((char)ch));
            }
        }

        while (!pq.isEmpty()) {
            // 不断选出最小元素打印
            System.out.print(pq.min());
            // 关联这个整数的对象被删除,从关联该整数的剩余流中再读取一个字符,并加入到索引优先队列中
            int i = pq.delMin();
            int ch;
            if ((ch=streams[i].read()) != -1) {
                pq.insert(i, String.valueOf((char)ch));
            }
        }
        System.out.println();
    }

    public static void main(String[] args) {

        InputStream stream1 = new ByteArrayInputStream("ACHYZ".getBytes());
        InputStream stream2 = new ByteArrayInputStream("BCRXY".getBytes());
        InputStream stream3 = new ByteArrayInputStream("ADPQS".getBytes());
        InputStream[] streams = {stream1, stream2 ,stream3};
        try {
            merge(streams); // AABCCDHPQRSXYYZ
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

上个例子中有三个输入流,merge方法刚开始给这三个输入流分别关联一个整数,然后从这三个输入流中分别读取一个字符到索引优先队列中。之后就打印三个字符中的最小者,A被打印然后删除,返回与A关联的整数,然后从与该整数关联的剩余流中再读取一个字符,并加入到索引优先队列中。此时的状态又回到每个输入流的元素都有一个存在于索引优先队列中。队列中始终保持只有三个元素,一直选出并删除最小元素,就完成了多向归并排序。

运行上面的代码会输出AABCCDHPQRSXYYZ。将三个序列归并排序成功!对于任意个输入流,merge方法都可以应对,并且队列所需空间和输入流的个数成正比,而不是和所有输入流的元素个数成正比,这可以在归并排序时节约大量内存。


by @sunhaiyu

2017.11.7

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,968评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,601评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,220评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,416评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,425评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,144评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,432评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,088评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,586评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,028评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,137评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,783评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,343评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,333评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,559评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,595评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,901评论 2 345

推荐阅读更多精彩内容

  • 这节总结一下优先队列的常用实现方法。 目录: 1、基本概念 2、基于数组实现的优先队列 2.1、基于有序数组的实现...
    Alent阅读 1,306评论 0 8
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,601评论 18 139
  • 数据结构与算法--优先队列和堆排序 在某些数据处理的例子中,总数据量太大,无法排序(甚至无法全部装进内存)。例如,...
    sunhaiyu阅读 1,031评论 0 2
  • 9.3.3 快速排序   快速排序将原数组划分为两个子数组,第一个子数组中元素小于等于某个边界值,第二个子数组中的...
    RichardJieChen阅读 1,833评论 0 3
  • 中秋节那天我和妈妈还有海琦姐一家去了坝上草原。 秋天的草原一望无垠,天空辽阔蔚蓝,景色美不胜收! 我和姐姐还有大大...
    萍8000阅读 297评论 0 1