兴业银行笔试题 -- 文本读取单词并按出现次数和字典序排序输出

先说个重点:兴业银行笔试给了我python2.7和3.9的环境做题,而我简历明明写的java...投的也是java相关的岗位...无语至极。我在python的环境里写了一会java代码,写不下去了,选择放弃。这里复盘一下,这在IDEA环境里写的。

  • 笔试题:给定一个文本,里面包含字符,数字,空格,标点符号,小数点。单词: 以空格为间隔的字符串为单词,不包括单词头尾的引号和小数点。数字与字母组成的也是单词,比如1st,3rd
  • 输出:将单词出现的次数按从多到少输出,输出格式为:word,count。若次数相同,按字典序的正序输出(a,b,c...)。

这里给出我的思路和解法

我的第一反应,HashMap+双向链表+自定义节点。map存储word和count,双向链表维护自定义节点Node,按次数和字典序排列。这里我没用API,而是自定义节点Node和头尾节点。

Node节点

    /** 内部类,定义了每个节点 */
    static class Node {
        String val;
        Node pre;
        Node next;
        int count;

        public Node(String val) {
            this.val = val;
            this.count = 1;
        }
    }
  1. 将读取到的当前行字符串转换成单词,同时统计次数,放入map中。这里还没有构建双向链表,因为如果一开始就构建链表,那单词的count每次改变,都要调整位置。
    /** 将当前行字符串转化成单词,并纳入map */
    public void convertStringToNode(String s) {
        int length = s.length();
        int ind = 0, left = 0;
        while (ind < length) {
            char c = s.charAt(ind);
            if (isNumOrLetter(c)) {
                ind++;
            } else {
                // skip: . " ' '; 如果此时前面一个是数字或字母,说明[left,ind)是单词
                if (isNumOrLetter(s.charAt(ind - 1))) {
                    // find next letter
                    String sTmp = s.substring(left, ind);
                    // put it into map
                    if (!map.containsKey(sTmp)) {
                        // 不包含该sTmp,创建一个并插入
                        map.put(sTmp, new Node(sTmp));
                    } else {
                        // 否则计数+1
                        map.get(sTmp).count++;
                    }
                    left = ++ind;
                } else {
                    // 若前面一个不是数字字母,说明遇到了连续空格,或者空格+引号等情况
                    left = ++ind;
                }
            }
        }
    }
  1. map添加结束后,就需要构建双向链表了,构建insert方法。compareString来比较次数和字典序。
    /** 比较两个不同字符串大小,s1大则返回1,s2大返回-1 */
    private int compareString(String s1, String s2) {
        int len1 = s1.length();
        int len2 = s2.length();
        // 都转成小写再比较
        s1 = s1.toLowerCase();
        s2 = s2.toLowerCase();

        int ind = 0;
        while (ind < len1 && ind < len2) {
            // 字符对应的ASCII越大,说明越靠后,在字典序中反而越小
            if (s1.charAt(ind) > s2.charAt(ind)) {
                return -1;
            } else if (s1.charAt(ind) < s2.charAt(ind)) {
                return 1;
            } else {
                ind++;
            }
        }
        if (len1 == len2) {
            return 0; // 应该用不到,因为比较的是两个不相同的字符串
        }
        return ind == len1 ? -1 : 1;
    }

    /** 向Node链表中插入一个Node */
    public void insertNodeIntoList(Node node) {
        if (head == null) {
            head = tail = node;
        } else {
            // head和tail非空
            Node index = tail;
            // 先按出现次数排序
            while (index != null && node.count > index.count) {
                index = index.pre;
            }
            // count相同比较字符串
            while (index != null && index.count == node.count && compareString(node.val, index.val) > 0) {
                index = index.pre;
            }
            /* 插在index下面 */
            if (index == null) {
                // 插在开头
                node.next = head;
                head.pre = node;
                head = node;
            } else if (index == tail) {
                // 插在结尾
                index.next = node;
                node.pre = index;
                tail = node;
            } else {
                // 插在中间
                node.next = index.next;
                index.next.pre = node;
                index.next = node;
                node.pre = index;
            }
        }
    }

    /** 调用 insertNodeIntoList 方法 */
    public void callInsertNode() {
        for (Map.Entry<String, Node> ele : map.entrySet()) {
            insertNodeIntoList(ele.getValue());
        }
    }

完整代码如下:

    Node head;  // head节点最靠前
    Node tail;  // tail节点最靠后
    Map<String, Node> map = new HashMap<>();

    /** 判断字符是不是数字或者字母 */
    private boolean isNumOrLetter(char c) {
        return ('a' <= c && c <= 'z') || ('A' <= c && c <= 'Z') || ('0' <= c && c <= '9');
    }

    /** 比较两个不同字符串大小,s1大则返回1,s2大返回-1 */
    private int compareString(String s1, String s2) {
        int len1 = s1.length();
        int len2 = s2.length();
        // 都转成小写再比较
        s1 = s1.toLowerCase();
        s2 = s2.toLowerCase();

        int ind = 0;
        while (ind < len1 && ind < len2) {
            // 字符对应的ASCII越大,说明越靠后,在字典序中反而越小
            if (s1.charAt(ind) > s2.charAt(ind)) {
                return -1;
            } else if (s1.charAt(ind) < s2.charAt(ind)) {
                return 1;
            } else {
                ind++;
            }
        }
        if (len1 == len2) {
            return 0; // 应该用不到,因为比较的是两个不相同的字符串
        }
        return ind == len1 ? -1 : 1;
    }

    /** 调用 insertNodeIntoList 方法 */
    public void callInsertNode() {
        for (Map.Entry<String, Node> ele : map.entrySet()) {
            insertNodeIntoList(ele.getValue());
        }
    }

    /** 向Node链表中插入一个Node */
    public void insertNodeIntoList(Node node) {
        if (head == null) {
            head = tail = node;
        } else {
            // head和tail非空
            Node index = tail;
            // 先按出现次数排序
            while (index != null && node.count > index.count) {
                index = index.pre;
            }
            // count相同比较字符串
            while (index != null && index.count == node.count && compareString(node.val, index.val) > 0) {
                index = index.pre;
            }
            /* 插在index下面 */
            if (index == null) {
                // 插在开头
                node.next = head;
                head.pre = node;
                head = node;
            } else if (index == tail) {
                // 插在结尾
                index.next = node;
                node.pre = index;
                tail = node;
            } else {
                // 插在中间
                node.next = index.next;
                index.next.pre = node;
                index.next = node;
                node.pre = index;
            }
        }
    }

    /** 将当前行字符串转化成单词,并纳入map */
    public void convertStringToNode(String s) {
        int length = s.length();
        int ind = 0, left = 0;
        while (ind < length) {
            char c = s.charAt(ind);
            if (isNumOrLetter(c)) {
                ind++;
            } else {
                // skip: . " ' '; 如果此时前面一个是数字或字母,说明[left,ind)是单词
                if (isNumOrLetter(s.charAt(ind - 1))) {
                    // find next letter
                    String sTmp = s.substring(left, ind);
                    // put it into map
                    if (!map.containsKey(sTmp)) {
                        // 不包含该sTmp,创建一个并插入
                        map.put(sTmp, new Node(sTmp));
                    } else {
                        // 否则计数+1
                        map.get(sTmp).count++;
                    }
                    left = ++ind;
                } else {
                    // 若前面一个不是数字字母,说明遇到了连续空格,或者空格+引号等情况
                    left = ++ind;
                }
            }
        }
    }
    
    /** 内部类,定义了每个节点 */
    static class Node {
        String val;
        Node pre;
        Node next;
        int count;

        public Node(String val) {
            this.val = val;
            this.count = 1;
        }
    }


    public static void main(String[] args) {
        Main main = new Main();
        try {
            File file = new File("D:/Users/JackTheRipper/Desktop/test.txt");
            InputStreamReader reader = new InputStreamReader(new FileInputStream(file));
            BufferedReader buffReader = new BufferedReader(reader);

            String strTmp;
            while ((strTmp = buffReader.readLine()) != null) {
                System.out.println(strTmp);
                // 将该行转成单词并纳入map
                main.convertStringToNode(strTmp);
            }
            buffReader.close();
            // 将map的内容纳入链表
            main.callInsertNode();

        } catch (IOException e) {
            e.printStackTrace();
        }

        // 输出结果
        Node cur = main.head;
        while (cur != null) {
            System.out.println(cur.val + "," + cur.count);
            cur = cur.next;
        }
    }

输出结果:

I am "Derrick Rose", Nicknamed "Wind City Rose".
I like basketball, I am very strong.
I do not like singing and rap, I am very week.
Forever Bull No1
I,5
am,3
like,2
Rose,2
very,2
and,1
basketball,1
Bull,1
City,1
Derrick,1
do,1
Forever,1
Nicknamed,1
not,1
rap,1
singing,1
strong,1
week,1
Wind,1
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,546评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,224评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,911评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,737评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,753评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,598评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,338评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,249评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,696评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,888评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,013评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,731评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,348评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,929评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,048评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,203评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,960评论 2 355

推荐阅读更多精彩内容