KMP算法

KMP算法的全称为Knuth-Morris-Pratt字符串查找算法，是可以在文本串s中快速查找模式串p的一种算法。

在详细讲解KMP算法之前，首先讲解一下暴力匹配。暴力匹配就是逐字符逐字符地进行匹配（比较s[i]和s[j]），如果当前字符匹配成功（s[i]==s[j]），就匹配下一个字符（i++;j++;）；如果匹配失败的话，就回溯（i=i-j+1;j=0;）。这样的算法时间复杂度是 $O(nm)$ 。

从上面可以看出暴力匹配算法，每次都会回溯到刚开始匹配的下一个字符，这样比较耗时，如果我们跳过之前匹配的字符从匹配失败的位置重新匹配，这样会出现缺漏。

为了解决这个问题，研究者引入了PMT（Partial Match Table，部分匹配表）。下一次j应该赋什么值只与模式串自身有关，即每个字符串都会对应一张PMT表。PMT中的pmt数组中位置i的内容是，从p[0]往后数、同时从p[i]往前数相同的位数，在保证前后缀相同的情况下，最多能数多少位。

KMP算法具体的匹配过程以ababcabaa为例：

Knuth-Morris-Pratt字符串查找算法-01.png

在匹配字符串的过程中，当我们在匹配j=8时发现s[i]与p[j]不相等，则会令j=pmt[j-1]=pmt[7]=3重新进行匹配，若此时s[i]与p[j]仍不相同，则继续令j进行回退。直至j回退到0处且仍不匹配时，我们不再令j回退，而选择移动i。

具体的KMP算法的正确匹配过程请阅读文献1。

KMP代码实现为：

public int strStr(String s, String p) {
    int n = s.length(), m = p.length();
    char[] cs = s.toCharArray(), cp = p.toCharArray();
    int[] next = next(p);

    for (int i = 0, j = 0; i < n; i++) {
        while (j != 0 && cs[i] != cp[j]) j = next[j - 1];
        if (cs[i] == cp[j]) j++;
        if (j == m) return i - j + 1;
    }

    return -1;
}

PMT表的生成过程，如果使用暴力的话，时间复杂度会是 $O(n^2)$ 。这种做法复杂度较高，因此我们采用更精妙的做法，错开一位后，让p自己匹配自己，即用前缀去匹配后缀。其具体过程为下图所示：

Knuth-Morris-Pratt字符串查找算法-02.png

PMT数组生成的代码为：

public int[] next(String p) {
    int m = p.length();
    int[] pmt = new int[m];

    char[] cs = p.toCharArray();

    for (int i = 1, j = 0; i < m; i++) {
        while (j != 0 && cs[i] != cs[j]) j = pmt[j - 1];
        if (cs[i] == cs[j]) j++;
        pmt[i] = j;
    }
    return pmt;
}

题目链接

数组和字符串-实现 strStr()

参考文献：

算法学习笔记(13): KMP算法

最后编辑于：2022.11.03 15:14:17

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,744评论 6赞 502
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,505评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,105评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,242评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,269评论 6赞 389
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,215评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,096评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,939评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,354评论 1赞 311
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,573评论 2赞 333
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,745评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,448评论 5赞 344
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,048评论 3赞 327
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,683评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,838评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,776评论 2赞 369
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,652评论 2赞 354

KMP算法

题目链接

推荐阅读更多精彩内容