Leetcode 10 - 正则表达式匹配(四种方法)

我的原文链接:http://ben-personal.top/2020/03/leetcode-10-regex/

本题要求实现一个简单的正则匹配,是动态规划的经典题型。在理解本题的过程中,可以形成动态规划的思维。本文将遵循我改进算法的思路,提供四种解题方法,在效率上逐渐提高。本文将通过Java实现,其他语言也很容易改写。

题目如下:

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

说明:

s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
示例 1:

输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:

输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。

链接:https://leetcode-cn.com/problems/regular-expression-matching

一、递归法

递归是最先能想到的思路。既然是字符串匹配,那匹配成功的部分就可以不再去管,转而对sp的剩下部分进行匹配。递归程序的Java实现如下:

    public boolean isMatch1(String s, String p) {
        if(p.isEmpty())
            return s.isEmpty();

        boolean firstMatch = (!s.isEmpty()) &&
                (p.charAt(0) == s.charAt(0) || p.charAt(0) == '.');

        if (p.length() > 1 && p.charAt(1) == '*')
            return firstMatch && isMatch1(s.substring(1), p) || isMatch1(s, p.substring(2));
        else
            return firstMatch && isMatch1(s.substring(1), p.substring(1));
    }

二、改进的递归

在第一种方法中,需要对字符串不断切分,效率很低。不妨通过传递索引加以避免。因此有了递归的改进版本:

    /**
     * @param i: p子串的起点
     * @param j: s子串的起点
     * @return
     */
    public boolean is_match2(int i, int j, String s, String p){
        if(i == p.length())
            return j == s.length();

        boolean firstMatch = (j < s.length()) &&
                (p.charAt(i) == s.charAt(j) || p.charAt(i) == '.');

        if(p.length()-i > 1 && p.charAt(i+1) == '*')
            return firstMatch && is_match2(i,j+1,s,p) || is_match2(i+2, j, s, p);
        else
            return firstMatch && is_match2(i+1, j+1, s, p);
    }

    public boolean isMatch2(String s, String p){
        return is_match2(0, 0, s, p);
    }

三、动态规划

方法二虽然解决了字符串切分的效率问题,但不难发现,仍存在重复计算的问题,因此可以通过动态规划,从后向前算,并将答案存储起来,避免重复的计算。

public boolean isMatch3(String s, String p){
        //dp[i][j]存储s[i:]能否与p[j:]匹配
        boolean[][] dp = new boolean[s.length()+1][p.length()+1];

        for (int i = p.length(); i >= 0; i--) {
            for (int j = s.length(); j >= 0; j--) {
                if(i == p.length())
                {
                    dp[j][i] = j == s.length();
                } else {
                    boolean firstMatch = (j < s.length()) &&
                            (p.charAt(i) == s.charAt(j) ||p.charAt(i) == '.');

                    if(p.charAt(i) == '*' && p.length()>i)
                        dp[j][i] = dp[j][i+1];
                    else if(p.length()-i > 1 && p.charAt(i+1) == '*')
                        dp[j][i] = firstMatch && dp[j+1][i] || dp[j][i+1];
                    else
                        dp[j][i] = firstMatch && dp[j+1][i+1];
                }
            }
        }

这里要注意一点,当p子串以'*'开头时,要单独讨论一下,容易分析出来,这时等价于去掉'*'(这样才能保证后续的判断正确)。

if(p.charAt(i) == '*' && p.length()>i)
  dp[j][i] = dp[j][i+1];

四、正向存储

方法三利用DP从后往前存储,避免重复计算,但实际上也有问题,有些子串的判断其实有多余。因为我们在做递归正向匹配的时候,很多子串并不需要进行匹配。

动态规划的思想其实很简单,不过就是将可能出现的重复特征提取出来,并存储起来。那何必拘泥于从后往前算呢?

因此方法四直接在方法二的基础上,加上一个数组用以存储已经算过的情况,每次递归时,判断一下是否算过即可:

    boolean[][] flag;
    boolean[][] dp;

    /**
     * @param i: p子串的起点
     * @param j: s子串的起点
     * @return
     */
    public boolean is_match4(int i, int j, String s, String p){
        if (flag[j][i]) {
            return dp[j][i];
        }

        if(i == p.length()) {
            dp[j][i] = j == s.length();
        } else{
            boolean firstMatch = (j < s.length()) &&
                    (p.charAt(i) == s.charAt(j) || p.charAt(i) == '.');

            if(p.length()-i > 1 && p.charAt(i+1) == '*') {
                dp[j][i] = firstMatch && is_match4(i,j+1,s,p) || is_match4(i+2, j, s, p);
            } else {
                dp[j][i] = firstMatch && is_match4(i+1, j+1, s, p);
            }
        }
        flag[j][i] = true;
        return dp[j][i];
    }

    //结合isMatch2和isMatch3的方法,
    //需要什么值就算什么,并存储,效率最高
    public boolean isMatch4(String s, String p){
        dp = new boolean[s.length()+1][p.length()+1];
        flag = new boolean[s.length()+1][p.length()+1];
        return is_match4(0, 0, s, p);
    }

抓住动态规划的思想:用存储的方式避免重复讨论,就不必拘于形式。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,723评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,485评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,998评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,323评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,355评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,079评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,389评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,019评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,519评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,971评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,100评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,738评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,293评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,289评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,517评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,547评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,834评论 2 345

推荐阅读更多精彩内容