数据结构(十七) -- 词典

一,词典

与前面介绍的映射结构一样,词典结构也是用来存放条目对象的一种容器,不过,词典与映射之间有一个非常重要的差别——词典不再要求其中各条目的关键码互异。

这一点与我们日常使用的纸介质词典类似,不少单次都具有多种解释,每一种解释分别对应于一个词条。因此,我们往往将词典中的条目直接称作“词条”。

总体而言,词典可以分为两大类:无序词典和有序词典
顾名思义,前一类词典中存放的条目无所谓次序,我们只能(利用某一判等器)比较一对条目(的关键码)是否相等;而在后一类词典所存放的条目之间,则(根据某一比较器)定义了某种全序关系,因此也相应地能够支持 first()、last()、prev()和 succ()之类的方法。

二,无序词典

无序词典的 ADT

操作方法 功能描述
find(key) 若词典中存在以 key 为关键码的条目,则返回该条目的数据对象 ;否则,返回 null
输入:一个关键码对象
输出:条目对象
findAll(key) 若词典中存在以 key 为关键码的条目,则返回这些条目组成的迭代器 ;否则,返回 null
输入:一个关键码对象
输出:条目对象的迭代器
insert(key, value) 插入条目(key, value),并返回该条目
输入:一个关键码对象和一个数据对象
输出:条目对象
remove(key) 若词典中存在以 key 为关键码的条目,则将摘除其中的一个并返回;否则,返回 null
输入:一个关键码对象
输出:条目对象
entries() 返回词典中所有关键码对象的一个迭代器
输入:无
输出:条目对象的迭代器
getSize() 报告词典的规模,即其中元素的数目
输入:无
输出:非负整数
isEmpty() 判断词典是否为空
输入:无
输出:布尔标志

无序词典的接口

package dsa.Dictionary;

import dsa.Iterator.Iterator;
import dsa.PriorityQueue.Entry;

public interface Dictionary {

    /*
     * (无序)词典结构接口
     */
    // 查询词典结构当前的规模
    public int getSize();

    // 判断词典结构是否为空
    public boolean isEmpty();

    // 若词典中存在以key为关键码的条目,则返回其中的一个条目;否则,返回null
    public Entry find(Object key);

    // 返回由关键码为key的条目组成的迭代器
    public Iterator findAll(Object key);

    // 插入条目(key, value),并返回该条目
    public Entry insert(Object key, Object value);

    // 若词典中存在以key为关键码的条目,则将摘除其中的一个并返回;否则,返回null
    public Entry remove(Object key);

    // 返回词典中所有条目的一个迭代器
    public Iterator entries();
}

基于列表实现的无序词典

package dsa.Dictionary;

import dsa.Iterator.Iterator;
import dsa.Iterator.IteratorElement;
import dsa.List.List;
import dsa.List.List_DLNode;
import dsa.Map.EqualityTester;
import dsa.Map.EqualityTesterDefault;
import dsa.PriorityQueue.Entry;
import dsa.PriorityQueue.EntryDefault;
import other.Position;

public class Dictionary_DLNode implements Dictionary {
    /*
     * 基于列表实现(无序)词典结构
     */
    private List L;// 存放条目的列表
    private EqualityTester T;// 判等器
    // 构造方法

    public Dictionary_DLNode() {
        this(new EqualityTesterDefault());
    }

    // 默认构造方法
    public Dictionary_DLNode(EqualityTester t) {
        L = new List_DLNode();
        T = t;
    }

    /***************************** ADT方法 *****************************/
    // 查询词典结构当前的规模
    public int getSize() {
        return L.getSize();
    }

    // 判断词典结构是否为空
    public boolean isEmpty() {
        return L.isEmpty();
    }

    // 若词典中存在以key为关键码的条目,则返回其中的一个条目;否则,返回null
    public Entry find(Object key) {
        Iterator P = L.positions();
        while (P.hasNext()) {
            Position pos = (Position) P.getNext();
            Entry entry = (EntryDefault) pos.getElem();
            if (T.isEqualTo(entry.getKey(), key))
                return entry;
        }
        return null;
    }

    // 返回由关键码为key的条目组成的迭代器
    public Iterator findAll(Object key) {
        List list = new List_DLNode();
        Iterator P = L.positions();
        while (P.hasNext()) {
            Position pos = (Position) P.getNext();
            Entry entry = (EntryDefault) pos.getElem();
            if (T.isEqualTo(entry.getKey(), key))
                list.insertLast(entry);
        }
        return new IteratorElement(list);
    }

    // 插入条目(key, value),并返回该条目
    public Entry insert(Object key, Object value) {
        Entry entry = new EntryDefault(key, value);// 创建新条目
        L.insertFirst(entry);// 将新条目插至表首,并
        return entry;// 返回null标志
    }

    // 若词典中存在以key为关键码的条目,则将摘除其中的一个并返回;否则,返回null
    public Entry remove(Object key) {
        Iterator P = L.positions();
        while (P.hasNext()) {// 逐一对比
            Position pos = (Position) P.getNext();// 各个位置
            Entry entry = (EntryDefault) pos.getElem();// 处的条目
            if (T.isEqualTo(entry.getKey(), key)) {// 若发现key已出现在某个条目中,则
                Entry oldEntry = entry;// 先保留该条目
                L.remove(pos);// 删除该条目
                return oldEntry;// 最后返回原先的条目
            }
        } // 若此循环结束,说明key尚未在词典中出现,因此
        return null;// 返回null标志
    }

    // 返回词典中所有条目的一个迭代器
    public Iterator entries() {
        return new IteratorElement(L);
    }// 直接利用List接口的方法生成元素迭代器
}

三,有序词典

上面所说的,基于无序列表实现的词典结构非常适用于解决网络访问日志之类的应用问题,这类问题的共同特点是:插入操作频繁,查找、删除操作却极少进行。

另外一些问题则正好相反,它们要求频繁地进行查询,但插入、删除操作相对更少,这方面的例子包括在线电话簿、订票系统等。

** 有序词典的 ADT **

从 ADT 的角度,有序词典可以看作是无序词典的扩充,也就是说,只需在无序词典 ADT 的基础上再增加以下操作:

操作方法 功能描述
first( ) 若词典非空,则返回其中关键码最小的条目;否则,返回 null
输入:无
输出:条目对象
last( ) 若词典非空,则返回其中关键码最大的条目;否则,返回 null
输入:无
输出:条目对象
successors(key) 返回由关键码不小于 key 的条目依非降序组成的迭代器
输入:一个关键码对象
输出:条目对象的迭代器
predecessors(key) 返回由关键码不大于 key 的条目依非升序组成的迭代器
输入:一个关键码对象
输出:条目对象的迭代器

有序词典接口

package dsa.Dictionary;

import dsa.Iterator.Iterator;
import dsa.PriorityQueue.Entry;

public interface SortedDictionary extends Dictionary {

    /*
     * 有序词典接口
     */

    // 若词典非空,则返回其中关键码最小的条目;否则,返回null
    public Entry first();

    // 若词典非空,则返回其中关键码最大的条目;否则,返回null
    public Entry last();

    // 返回由关键码不小于key的条目依非降序组成的迭代器
    public Iterator successors(Object key);

    // 返回由关键码不大于key的条目依非升序组成的迭代器
    public Iterator predecessors(Object key);
}

这里利用可扩充数组实现有序查找表,并在此基础上利用二分查找算法

package dsa.Dictionary;

import dsa.Iterator.Iterator;
import dsa.Iterator.IteratorElement;
import dsa.List.List;
import dsa.List.List_DLNode;
import dsa.PriorityQueue.Comparator;
import dsa.PriorityQueue.ComparatorDefault;
import dsa.PriorityQueue.Entry;
import dsa.PriorityQueue.EntryDefault;
import dsa.Vector.Vector;
import dsa.Vector.Vector_ExtArray;

public class SortedDictionary_ExtArray implements SortedDictionary {

    /*
     * 基于有序查找表实现的有序词典
     */

    Vector S;// 有序查找表
    Comparator C;// 比较器
    // 默认构造方法

    public SortedDictionary_ExtArray() {
        this(new ComparatorDefault());
    }

    // 构造方法
    public SortedDictionary_ExtArray(Comparator comp) {
        S = new Vector_ExtArray();
        C = comp;
    }

    /**************************** 辅助方法 ****************************/
    // 二分查找
    // 返回值可能是命中元素的秩,也可能是key可以插入的秩
    // 具体如何,需要进一步检查
    // 不变性:若将key按照返回的秩插入有序向量,向量依然有序
    private static int binSearch(Vector s, Comparator c, Object key, int lo, int hi) {
        if (lo > hi)
            return lo;// 递归基,查找失败
        int mi = (lo + hi) >> 1;// 取中值
        Entry e = (Entry) s.getAtRank(mi);// 居中的条目
        int flag = c.compare(key, e.getKey());// 比较关键码
        if (flag < 0)
            return binSearch(s, c, key, lo, mi - 1);// 转向左半区间
        else if (flag > 0)
            return binSearch(s, c, key, mi + 1, hi);// 转向右半区间
        else
            return mi;// 命中
    }

    /**************************** 无序词典ADT方法 ****************************/
    // 查询词典结构当前的规模
    public int getSize() {
        return S.getSize();
    }

    // 判断词典结构是否为空
    public boolean isEmpty() {
        return S.isEmpty();
    }

    // 若词典中存在以key为关键码的条目,则返回其中的一个条目;否则,返回null
    public Entry find(Object key) {
        int k = binSearch(S, C, key, 0, S.getSize() - 1);// 查找关键码为key的条目
        if (0 > k || k >= S.getSize() || (0 != C.compare(key, ((Entry) S.getAtRank(k)).getKey())))
            return null;// 若这样的条目不存在,则返回失败标志
        return (Entry) S.getAtRank(k);
    }

    // 返回由关键码为key的条目组成的迭代器
    public Iterator findAll(Object key) {
        List L = new List_DLNode();// 创建一个链表L
        int k = binSearch(S, C, key, 0, S.getSize() - 1);// 查找关键码为key的条目
        if (0 > k || k >= S.getSize() || (0 != C.compare(key, ((Entry) S.getAtRank(k)).getKey())))
            return new IteratorElement(L);// 若这样的条目不存在,则返回空迭代器
        L.insertFirst(S.getAtRank(k));// 将e插入L中
        int lo = k;// 从S[k-1]开始
        while (0 <= --lo) {// 不断向前搜索
            if (0 != C.compare(key, ((Entry) S.getAtRank(lo)).getKey()))
                break;// 直到第一个不命中的条目
            L.insertFirst(S.getAtRank(lo));// 将命中的条目插入L中
        }
        int hi = k;// 从S[k+1]开始
        while (++hi < S.getSize()) {// 不断向后搜索
            if (0 != C.compare(key, ((Entry) S.getAtRank(hi)).getKey()))
                break;// 直到第一个不命中的条目
            L.insertLast(S.getAtRank(hi));// 将命中的条目插入L中
        }
        return new IteratorElement(L);// 由L创建迭代器,返回之
    }

    // 插入条目(key, value),并返回该条目
    public Entry insert(Object key, Object value) {
        Entry e = new EntryDefault(key, value);// 创建新条目
        // 若词典为空,则直接插入新元素
        if (S.isEmpty())
            return (Entry) S.insertAtRank(0, e);
        // 通过二分查找,确定可插入位置
        // 请读者自己检查:即便key在S中为最小或最大,都可以正常插入
        return (Entry) S.insertAtRank(binSearch(S, C, key, 0, S.getSize() - 1), e);
    }

    // 若词典中存在以key为关键码的条目,则将摘除其中的一个并返回;否则,返回null
    public Entry remove(Object key) {
        int k = binSearch(S, C, key, 0, S.getSize() - 1);// 查找关键码为key的条目
        if (0 > k || k >= S.getSize() || (0 != C.compare(key, ((Entry) S.getAtRank(k)).getKey())))
            return null;// 若这样的条目不存在,则返回失败标志
        return (Entry) S.removeAtRank(k);
    }

    // 返回词典中所有条目的一个迭代器
    public Iterator entries() {
        List L = new List_DLNode();
        for (int i = 0; i < S.getSize(); i++)
            L.insertLast(S.getAtRank(i));
        return new IteratorElement(L);// 直接利用List接口的方法生成元素迭代器
    }

    /**************************** 有序词典ADT方法 ****************************/
    // 若词典非空,则返回其中关键码最小的条目;否则,返回null
    public Entry first() {
        return (S.isEmpty()) ? null : (Entry) S.getAtRank(0);
    }

    // 若词典非空,则返回其中关键码最大的条目;否则,返回null
    public Entry last() {
        return (S.isEmpty()) ? null : (Entry) S.getAtRank(S.getSize() - 1);
    }

    // 返回由关键码不小于key的条目依非降序组成的迭代器
    public Iterator successors(Object key) {
        List L = new List_DLNode();// 创建一个链表L
        int k = binSearch(S, C, key, 0, S.getSize() - 1);// 查找关键码为key的条目
        if (0 > k || k >= S.getSize() || (0 != C.compare(key, ((Entry) S.getAtRank(k)).getKey())))
            return new IteratorElement(L);// 若这样的条目不存在,则返回空迭代器
        while (0 <= --k)// 从S[k-1]开始向前搜索,直至符合要求的、秩最小的元素
            if (0 != C.compare(key, ((Entry) S.getAtRank(k)).getKey()))
                break;
        while (S.getSize() > ++k)// 将后继的所有元素依次
            L.insertLast(S.getAtRank(k));// 插入L中
        return new IteratorElement(L);// 由L创建迭代器,返回之
    }

    // 返回由关键码不大于key的条目依非升序组成的迭代器
    public Iterator predecessors(Object key) {
        List L = new List_DLNode();// 创建一个链表L
        int k = binSearch(S, C, key, 0, S.getSize() - 1);// 查找关键码为key的条目
        if (0 > k || k >= S.getSize() || (0 != C.compare(key, ((Entry) S.getAtRank(k)).getKey())))
            return new IteratorElement(L);// 若这样的条目不存在,则返回空迭代器
        while (S.getSize() > ++k)// 从S[k-1]开始向后搜索,直至符合要求的、秩最大的元素
            if (0 != C.compare(key, ((Entry) S.getAtRank(k)).getKey()))
                break;
        while (0 <= --k)// 将前驱的所有元素依次
            L.insertLast(S.getAtRank(k));// 插入L中
        return new IteratorElement(L);// 由L创建迭代器,返回之
    }
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,393评论 5 467
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,790评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,391评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,703评论 1 270
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,613评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,003评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,507评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,158评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,300评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,256评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,274评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,984评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,569评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,662评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,899评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,268评论 2 345
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,840评论 2 339

推荐阅读更多精彩内容

  • B树的定义 一棵m阶的B树满足下列条件: 树中每个结点至多有m个孩子。 除根结点和叶子结点外,其它每个结点至少有m...
    文档随手记阅读 13,129评论 0 25
  • 1、线性表、栈和队列等数据结构所表达和处理的数据以线性结构为组织形式。栈是一种特殊的线性表,这种线性表只能在固定的...
    雾熏阅读 2,372评论 0 10
  • 如果沿途的风景不是那么美妙 如果我们依然能把生活跳出舞蹈 在老去的岁月里 看到彼此少年的模样与欢...
    岩桐诗社阅读 330评论 0 2
  • 据说堵车是一个城市经济发达的象征。不过不能绝对。 我所在的城市这几年才开始出现这个象征,然而据我观察,个中原因错综...
    苟富贵阅读 186评论 0 1
  • 学员:赵欣淏、李兰葳 时间:7月27日 任课教师:张老师 课程目标:1.了解汉堡包结构和互锁结构 2.学习齿轮传动...
    蔓越莓m曲奇_阅读 350评论 0 0