数据结构和算法回顾-kmp

KMP字符串查找算法通过运用对这个词在不匹配时本身就包含足够的信息来确定下一个匹配将在哪里开始的发现,从而避免重新检查先前匹配的字符。

*此算法的核心是跳过肯定无法匹配的部分,达到高效匹配的目的。 *

这里有一个可能很清晰介绍kmp的blog, 不过没有代码实现,也没有讲原因。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
/**
 * 字符串模式匹配 之 BF算法
 * Author : Yonggang Yuan
 */
#define EOS '\0' // End Of String
int main() {
    char text[] = "s a good,Yonggang Yuan is a good student, is a good student twice ... is a good";
    char m[] = "s a good";
    int i, lenOfM = strlen(m);
    for( i=0; *(text+i) != EOS; i++ ) {
        if( memcmp(m, text+i, lenOfM) == 0 ) {
            printf("Match m at %d\n", i);
        }
    }

    return 0;
}
  • 前后缀
    一个字符串 ABCABKKJSCNABCAB
    前后缀为: 1)AB 2)ABCAB
    最大前后缀为: ABCAB
  • 跳过哪一部分
    移动位数 = 已匹配的字符数 - 对应的部分匹配值
    部分匹配值就是最大前后缀
    下面有两个字符串
串a A B C A B K K J S C N A B C A B
i 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

|串b |A|B|C|A|B|D|F|
|---|-|-|-|-|-|-|-|-|
|j|0|1|2|3|4|5|6|7|8|9|10|11|12|13|14|15|

在a[i=5],b[j=5]时候失配,按照kmp算法,下一步就应该串b就应该向右移动(已匹配数-最大前后缀),用代码表示就应该为i不变,j=next[j-1]。
怎么理解j=next[j-1]?
next是字符串b的最大前后缀大小值组成的数组,比如子串b[0~5]的最大前后缀为AB,值也就为2,所以next[4]=2。而j=next[j-1]就表示j的下标变为b[j]前面的字符串的最大前后缀,

上面这个例子可以用下图表示

i 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
串a A B C A B K K J S C N A B C A B
串b A B C A B D F
j 0 1 2 3 4 5 6 7

从i[5],j[2]开始重新匹配,相对于暴力匹配法跳过i[12],由于i[34]与j[0~1]必然相等,也被忽略。

为什么i[1~2]可以直接跳过,会不会从i[1],j[0]开始直接匹配上了,那我来看看这情况,如下图

i 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
串a A B C A B K K J S C N A B C A B
串b A B C A B D F
j 0 1 2 3 4 5 6 7

因为在i[5],j[5]处失配,所以i[5]应该和什么匹配未知,已知的条件不能判断,而用已知条件只要证明i[14]与j[03]绝对不匹配就行了,
已知条件:
1)i[04]与j[04]已经匹配上了
2)next数组(看做已知的,后面在详细求解)
如果上图的情况能匹配上,那么i[14]=j[03],又已知i[14]=j[14],所以j[03]=j[14]所以j[03]和j[14]是j[04]的前后缀,然而ABCAB的最大前后缀是AB值为2,已经矛盾了,所以i[14]与1[0~3]绝对不匹配,可以跳过。

  • next数组
    next[k]也就是字符串b[0~k]的最大前后缀,数组求法有点像数学归纳法,首先我们知道next[0]=0,然后递归求取next[1],next[2]...next[n]。
    一步步来看,先判断b[1]和b[0]是不是相等,如果相等那b[0],b[1]就为b[0~1]的前后缀
  • golang代码实现
func KmpMatch(astring string, bstring string) int {
        i, j := 1, 0
        next := make([]int, len(bstring))
        next[0] = 0
        for i < len(bstring) {
                if bstring[i] == bstring[j] {
                        next[i] = j + 1
                        i++
                        j++
                } else if j == 0 {
                        next[i] = 0
                        i++
                } else {
                        j = next[j]
                }
        }
        i, j = 0, 0
        for i < len(astring) {
                if astring[i] == bstring[j] {
                        if j == len(bstring)-1 {
                                return i
                        }
                        i++
                        j++
                } else {
                        if j > 0 {
                                j = next[j-1]
                        } else {
                                j = 0
                                i++
                        }
                }
        }
        return 0
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容