字符串匹配(动态规划)

1.通配符匹配(44 - 难)

题目描述:给定一个字符串 (s) 和一个字符模式 (p) ,实现一个支持 '?' 和 '*' 的通配符匹配。

  • '?' 可以匹配任何单个字符。
  • '*' 可以匹配任意字符串(包括空字符串)。

说明:

  • s 可能为空,且只包含从 a-z 的小写字母。
  • p 可能为空,且只包含从 a-z 的小写字母,以及字符 ? 和 *

示例 :

输入:
s = "adceb"
p = "*a*b"
输出: true
解释: 第一个 '*' 可以匹配空字符串, 第二个 '*' 可以匹配字符串 "dce".

思路:本题是典型的字符串匹配的题目。动态规划:

  • dp[i][j] :p的前i个字符与s的前j个字符是否匹配
  • 状态转移方程:根据匹配规则,分为两种情况
    • 两个字符串对应位置相同或者p串对应位置为“?”
    • p串对应位置为“*”,此时星号可以匹配字母或者是空字符

注意:当p为空且s不为空,一定不能匹配;反之不一定,如果p串全部为星号,则能匹配(全部匹配空)。

代码实现:

public boolean isMatch(String s, String p) {
    int len1 = p.length();
    int len2 = s.length();
    boolean[][] dp = new boolean[len1 + 1][len2 + 1];
    dp[0][0] = true;
    for (int i = 1; i < len1 + 1; i++) {
        if (p.charAt(i - 1) != '*') {
            break;
        }
        dp[i][0] = true;
    }

    for (int i = 1; i < len1 + 1; i++) {
        for (int j = 1; j < len2 + 1; j++) {
            if (p.charAt(i - 1) == s.charAt(j - 1) || p.charAt(i - 1) == '?') {
                dp[i][j] = dp[i - 1][j - 1];
            } else if (p.charAt(i - 1) == '*') {
                dp[i][j] = dp[i - 1][j] || dp[i][j - 1];
            }
        }
    }
    return dp[len1][len2];
}

2.正则表达式匹配(10 - 难)

题目描述:给你一个字符串 s 和一个字符规律 p(都可为空),请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

  • '.' 匹配任意单个字符
  • '*' 匹配零个或多个前面的那一个元素

所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

注意:题目保证每次出现星号,前面都能匹配到有效字符!

示例 :

输入:s = "ab" p = ".*"
输出:true
解释:".*" 表示可匹配零个或多个('*')任意字符('.')。

思路:本题与上一题类似,但是本题难点在于讨论星号的情况:

  • 匹配不上,可以将字符+*全部忽略,即匹配0个
  • 如果能够匹配上,匹配0个,或者匹配掉s串的当前字符。

注意:当s为空且p不为空,需要检查p的结构;反之一定不能匹配。

代码实现:

public boolean isMatch(String s, String p) {
    int len1 = p.length();
    int len2 = s.length();
    boolean[][] dp = new boolean[len1 + 1][len2 + 1];
    dp[0][0] = true;
    // 对于匹配串s为空且p不为空,判断模式串是否为【字符+*】结构
    for (int i = 1; i < len1 + 1; i++) {
        if (p.charAt(i - 1) == '*') {
            dp[i][0] = dp[i - 2][0];
        } 
    }
    for (int i = 1; i < len1 + 1; i++) {
        for (int j = 1; j < len2 + 1; j++) {
            if (p.charAt(i - 1) == '*') {
                if (p.charAt(i - 2) == s.charAt(j - 1) || p.charAt(i - 2) == '.') {
                    dp[i][j] = dp[i - 2][j] || dp[i][j - 1];
                } else {
                    dp[i][j] = dp[i - 2][j];
                }
            } else {
                if (p.charAt(i - 1) == s.charAt(j - 1) || p.charAt(i - 1) == '.') {
                    dp[i][j] = dp[i - 1][j - 1];
                }
            }
        }
    }
    return dp[len1][len2];
}

3.编辑距离(72 - 难)

题目描述:给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。

你可以对一个单词进行如下三种操作:

  • 插入一个字符
  • 删除一个字符
  • 替换一个字符

示例 :

输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')

思路:本题word1可以看成模式串,即字符串匹配问题。

  • dp[i][j] :word1前i个字符转换成word2前j个字符的最少操作数
  • 状态转移方程:关键是讨论三种操作状态,取最小值+1,做为当前的最小操作数
    • 插入操作:dp[i][j - 1],即等于word1前i个字符转换成word2前j - 1个字符的最少操作数
    • 删除操作(即不用word1第i个元素):dp[i - 1][j],即等于word1前i - 1个字符转换成word2前j个字符的最少操作数
    • 替换操作:dp[i - 1][j - 1]
  • 初始化:
    • word1为空且word2不为空,最小转化次数为word1.length(),即全部添加;
    • 否则,最小转化次数为word2.length(),即全部删除。

代码实现:

public int minDistance(String word1, String word2) {
    int len1 = word1.length();
    int len2 = word2.length();
    int[][] dp = new int[len1 + 1][len2 + 1];
    for (int i = 1; i < len1 + 1; i++) {
        dp[i][0] = i;
    }
    for (int j = 1; j < len2 + 1; j++) {
        dp[0][j] = j;
    }

    for (int i = 1; i < len1 + 1; i++) {
        for (int j = 1; j < len2 + 1; j++) {
            if (word1.charAt(i - 1) == word2.charAt(j - 1)) {
                dp[i][j] = dp[i - 1][j - 1];
            } else {
                dp[i][j] = Math.min(Math.min(dp[i - 1][j], dp[i][j - 1]), dp[i - 1][j - 1]) + 1;
            }
        }
    }
    return dp[len1][len2];
}

4.最长公共子序列(1143 - 中)

题目描述:给定两个字符串 text1text2,返回这两个字符串的最长 公共子序列 的长度。如果不存在 公共子序列 ,返回 0

一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。例如,"ace""abcde" 的子序列,但 "aec" 不是 "abcde" 的子序列。

两个字符串的 公共子序列 是这两个字符串所共同拥有的子序列。

示例 :

输入:text1 = "abcde", text2 = "ace" 
输出:3  
解释:最长公共子序列是 "ace" ,它的长度为 3 。

思路:本题与上题类似,使用动态规划解决比较好,因为本题没有规定谁是谁的子串。

关键是:当两个字符不同是,我们需要取 i 字符或 j 字符不取的最大值。具体见代码。

代码实现:

public int longestCommonSubsequence(String text1, String text2) {
    int m = text1.length(), n = text2.length();
    int[][] dp = new int[m + 1][n + 1];

    for (int i = 1; i <= m; i++) {
        for (int j = 1; j <= n; j++) {
            if (text1.charAt(i - 1) == text2.charAt(j - 1)) {
                dp[i][j] = dp[i - 1][j - 1] + 1;
            } else {
                dp[i][j] = Math.max(dp[i][j - 1], dp[i - 1][j]);
            }
        }
    }
    return dp[m][n];
}

5.两个字符串的删除操作(583 - 中)

题目描述:给定两个单词 word1word2,找到使得 word1word2 相同所需的最小步数,每步可以删除任意一个字符串中的一个字符。

示例 :

输入: "sea", "eat"
输出: 2
解释: 第一步将"sea"变为"ea",第二步将"eat"变为"ea"

思路:将问题转化一下,本题本质:求两个字符串的最长子序列,与上题相同,最后直接返回多余的长度,即使两个字符串相同的最小操作次数。

ps:先将字符串转化为字符数组的方式比直接使用charAt()效率高。

代码实现:

public int minDistance(String word1, String word2) {
    int m = word1.length(), n = word2.length();
    char[] str1 = word1.toCharArray();
    char[] str2 = word2.toCharArray();
    int[][] dp = new int[m + 1][n + 1];

    for (int i = 1; i < m + 1; i++) {
        for (int j = 1; j < n + 1; j++) {
            if (str1[i - 1] == str2[j - 1]) {
                dp[i][j] = dp[i - 1][j - 1] + 1;
            } else {
                dp[i][j] = Math.max(dp[i - 1][j], dp[i][j - 1]);
            }
        }
    }
    return m + n - 2 * dp[m][n];
}

6.不相交的线(1035 - 中)

题目描述:在两条独立的水平线上按给定的顺序写下 nums1 和 nums2 中的整数。

现在,可以绘制一些连接两个数字 nums1[i] 和 nums2[j] 的直线,这些直线需要同时满足满足:

  • nums1[i] == nums2[j]
  • 且绘制的直线不与任何其他连线(非水平线)相交。

请注意,连线即使在端点也不能相交:每个数字只能属于一条连线

以这种方法绘制线条,并返回可以绘制的最大连线数。

示例 :

输入:nums1 = [1,4,2], nums2 = [1,2,4]
输出:2
解释:可以画出两条不交叉的线,如上图所示。 
但无法画出第三条不相交的直线,因为从 nums1[1]=4 到 nums2[2]=4 的直线将与从 nums1[2]=2 到 nums2[1]=2 的直线相交。

思路:本题本质:找两个数组的最长重复子序列,最长子序列的长度就是可以绘制的最大连接数。

ps:对于自定义的数据类型++i的效率高于i++。但是有的编译器进行了优化。

  • 原因:i++需要先取出i值,再进行+1,所以用到temp存放当前值。i++必须要有一个临时对象才可以完成

代码实现:

public int maxUncrossedLines(int[] nums1, int[] nums2) {
    int n1 = nums1.length, n2 = nums2.length;
    int[][] dp = new int[n1 + 1][n2 + 1];
    for (int i = 1; i < n1 + 1; ++i) {
        for (int j = 1; j < n2 + 1; ++j) {
            if (nums1[i - 1] == nums2[j - 1]) {
                dp[i][j] = dp[i - 1][j - 1] + 1;
            } else {
                dp[i][j] = Math.max(dp[i - 1][j], dp[i][j - 1]);
            }
        }
    }
    return dp[n1][n2];
}

7.最长重复子数组(718 - 中)

题目描述:给两个整数数组 AB ,返回两个数组中公共的、长度最长的子数组的长度。

示例 :

输入:
A: [1,2,3,2,1]
B: [3,2,1,4,7]
输出:3
解释:
长度最长的公共子数组是 [3, 2, 1] 。

思路:dp数组定义与上述公共子序列基本相同。

  • dp[i][j]表示第一个数组 A 前 i 个元素和数组 B 前 j 个元素组成的最长公共子数组(相当于子串)的长度。

  • 与公共子序列不同的是,当两个数组元素对比不同时,因为子数组是连续的,所以 dp[i][j] == 0

注意:由于状态方程不同,当不相同时清零,所以我们要更新最大值。

代码实现:

public int findLength(int[] nums1, int[] nums2) {
    int m = nums1.length;
    int n = nums2.length;
    int max = 0;
    int[][] dp = new int[m + 1][n + 1];
    for (int i = 1; i < m + 1; ++i) {
        for (int j = 1; j < n + 1; ++j) {
            if (nums1[i - 1] == nums2[j - 1]) {
                dp[i][j] = dp[i - 1][j - 1] + 1;
            } else {
                dp[i][j] = 0;
            }
            max = Math.max(max, dp[i][j]);
        }
    }
    return max;
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,919评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,567评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,316评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,294评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,318评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,245评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,120评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,964评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,376评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,592评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,764评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,460评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,070评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,697评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,846评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,819评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,665评论 2 354

推荐阅读更多精彩内容