面试题19/leetcode10:正则表达式匹配 C++

题目:请实现一个函数用来匹配包含 .* 的正则表达式。模式中的字符.表示任意一个字符,而 *表示它前面的字符可以出现任意次(含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但与模式"aa.a"及"ab*a"均不匹配。

分析:这道题的核心其实在于分析'*', 对于'.'来说,它和任意字符都匹配,可把其当做普通字符。对于'*'的分析,我们要进行分情况讨论,当所有的情况都搞清楚了以后,就可以写代码了。

  1. 当Patttern第二个字符不是*时,情况简单:
    如果字符串的第一个字符和模式中的第一个字符匹配,那么在字符串和模式上都向后移动一个字符,然后匹配剩余字符串和模式。
    如果字符串的第一个字符和模式中的第一个字符不匹配,那么直接返回false。

  2. 在每轮匹配中,Patttern第二个字符是'*'时,情况复杂:

  • 第一个字符不匹配(除了'.'与任意字符视作匹配),那么这时'*'只能代表匹配0次,比如''ba''与''a*ba'',字符串不变,模式向后移动两个字符,然后匹配剩余字符串和模式。
  • 第一个字符匹配,那么'*'可能代表匹配1次,多次,0次,比如"aba"与"a * ba"、 ''aaaba''与''a*ba'', ''ba''与''b*ba''。匹配1次时,字符串往后移动一个字符,模式向后移动2个字符;匹配多次时,字符串往后移动一个字符,模式不变;


1.递归

c code:通过

#include <iostream>      
using namespace std;

bool matchCore(char* str, char* pattern);
bool match(char* str, char* pattern)
{
    if (str == nullptr || pattern == nullptr)
        return false;
    return matchCore(str,pattern);
}

bool matchCore(char* str, char* pattern)
{
    if (*str == '\0'&&*pattern == '\0')
        return true;
    
    if (*str != '\0'&&*pattern == '\0')
        return false;

    if (*(pattern + 1) == '*')//复杂情况
    {
        if (*pattern == *str || (*pattern == '.' && *str != '\0'))
        {
            //分别表示匹配1次,多次,0次
            return matchCore(str + 1, pattern + 2) || matchCore(str + 1, pattern) || matchCore(str, pattern + 2);
        }
        else
            return matchCore(str, pattern + 2);//表示匹配0次,跳过pattern‘*’
    }
    
    if (*pattern == *str || (*pattern == '.' && *str != '\0'))//简单情况
        return matchCore(str + 1, pattern + 1);

    return false;//所有情况都不满足

}
int main() {
    char str[20];
    char pattern[20];
    cin>>str;
    cin>>pattern; 
 
    if (match(str, pattern))
        cout << "match" << endl;
    else
        cout << "not match" << endl;
  
    return 0;
}
test

c++ code递归法:

  • leetcode 上超出时间限制 然而上述的c code可以通过
  • 同样的算法为甚c++超时,char*比string类更加近原生层(听说STL除外,大部分c比c++快)
class Solution {
public:
    bool isMatch(string s, string p) {
     
        if (s.empty() && p.empty())
            return true;
         
        return match(s, 0, p, 0);
    }
    bool match(string s, int sIndex, string p, int pIndex){

        if (sIndex == (s.length()) && pIndex == (p.length()))//递归结束的条件
            return true;
         
         

        if (p[pIndex + 1] == '*'){  //复杂情况
            if (p[pIndex] == s[sIndex] || (p[pIndex] == '.'&&sIndex <= (s.length() - 1)))
                return match(s, sIndex, p, pIndex + 2) || match(s, sIndex + 1, p, pIndex + 2) || match(s, sIndex + 1, p, pIndex);
            else
                return match(s,sIndex,p,pIndex+2);
        }
        if (p[pIndex] == s[sIndex] || (p[pIndex] == '.'&&sIndex <=(s.length() - 1)))    //简单情况
            return match(s, sIndex + 1, p, pIndex + 1);
        return false;
    }
};


2.动态规划:

首先我们建立了一个 m*n 的二维dp矩阵,其中m表示匹配模式字符串 p 的长度,n表示待匹配字符串 s 的长度。则 dp[i][j] 表示子字符串 p[:i]s[:j](均包含i和j)是否匹配(true/false)。假设目前已知 dp[i][j-1] 及其前面的所有情况的匹配关系,那么要求dp[i][j]通过动态规划的递推关系如下:

1. 假如 p[i] == '.',则dp[i][j] = dp[i-1][j-1]
2. 假如 p[i] == letter(a-zA-Z),则dp[i][j] = dp[i-1][j-1] && (p[i]==s[j])
3. 假如 p[i] == '*',则 dp[i][j] = dp[i-2][j] || 
                                  dp[i-1][j] || 
                                  (dp[i][j-1] && (p[i-1] == s[j]))

上面的1,2 均比较好理解,关键是出现 *时要分三种情况讨论,分别是 * 匹配了0个,1个,和若干个前一字符。假如匹配了0个前一字符,那么当前位置的匹配结果与dp[i-2][j]相同;匹配了1个前一字符,则当前位置的匹配结果与 dp[i-1][j]相同;关键是假如匹配了多个前一字符,该如何判断,此时我们无法知道到底匹配了多少个前一字符,但是换个角度去想这个问题,假如匹配了多个前一字符,那么前一字符要与当前的s[j]匹配(p[i-1]==s[j] 或 p[i-1]=’.’),此时要想匹配成功(dp[i][j]为true),则当前的匹配串(p[:i])必须能够匹配s[:j-1],也就是dp[i][j-1]为true。对于这三种情况出现任意一种均可认为匹配,因此取或操作。

在具体实现中还要注意数组越界的问题,可以看到上面出现了 i-1,j-1,i-2的下标,那么在实现的时候要在原二维矩阵中各增加一行和一列,表示第0个字符也就是空字符从而避免了i-1的越界;同时只有在遇到*时才会出现i-2的下标,且这种情况下只有当*出现在匹配串第一个的时候才会越界,而当*出现在匹配串的第一个字符的时候表示为空字符串,除了待匹配字符串为空时一律为false。
C++ 动态开辟二维数组

  • vector<vector<bool>>dp(m,vector<bool>(n));
  •   bool **dp=NULL;
      dp = new bool *[m];
      for (int i = 0; i < m; i++)
      {
          dp[i] = new bool[n];
      }
    

c++ code : 8ms

class Solution {
public:
    bool isMatch(string s, string p) {
        int m = p.length() + 1; int n = s.length() + 1;
        //vector<vector<bool>>dp(m,vector<bool>(n));
        bool **dp=NULL;
        dp = new bool *[m];
        for (int i = 0; i < m; i++)
        {
            dp[i] = new bool[n];
        }

        for (int i = 0; i < m; i++)
        {
            for (int j = 0; j < n; j++)
            {
                if (i == 0)//初始化
                {
                    if (j == 0)dp[i][j] = true;
                    else dp[i][j] = false;
                }
                else if (j == 0)
                {//i只可能是1开始
                    if (p[i - 1] != '*')dp[i][j] = false;
                    else dp[i][j] = dp[i - 1][j] || dp[i - 2][j];////p第一个是*的,s第一个是空,短路操作不会越界,所以不能调换,细节
                }
                else
                {
                    if (p[i - 1] == '.')dp[i][j] = dp[i - 1][j - 1];
                    else if (p[i - 1] == '*')
                    {
                        if (i == 1)dp[i][j] = false; //第一个是*的其他情况
                        else  dp[i][j] = dp[i - 2][j]
                                       || dp[i - 1][j] 
                                       || ((p[i-2]=='.'||p[i-2]==s[j-1])&&dp[i][j - 1]);
                    }
                    else dp[i][j] = ((s[j - 1] == p[i - 1] )&& dp[i - 1][j - 1]);
                    

                }
            }
            
        }
        return dp[m - 1][n - 1];
    }
     
};


substr
C++关于 nullptr
参考1:剑指offer书----何海涛
一生不可自决
参考2

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,454评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,553评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,921评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,648评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,770评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,950评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,090评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,817评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,275评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,592评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,724评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,409评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,052评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,815评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,043评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,503评论 2 361
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,627评论 2 350

推荐阅读更多精彩内容