KMP(看xx)算法及扩展

题目:

用来求解字符串匹配问题,比如str1中是否包含str2,如果包含就返回str2在str1中开始的位置,不包含返回-1。

思路:

1.在这里我们首先要知道何为最大前缀,何为最大后缀,由下图所示


image.png

在这里要用到next数组,何为next数组呢,next数组就是一个存储i位置(i位置之前的)最大前缀和最大后缀匹配长度的数组,比如一个数组[a,b,c,a,b] next值[-1,0,0,0,1],在这里规定最大前缀不包括最后一个字符,最大后缀不包括第一个字符,具体看下图实例讲解以及代码注释


看毛片.png

当cn位置的值和i-1不相等时,cn=next[cn]的情况可由下图看出


image.png

代码:

    public static int KMP(String s1,String s2){
        if (s1==null||s2==null||s1.length()<1||s2.length()<1){
            return -1;
        }

        char[] str1 = s1.toCharArray();
        char[] str2 = s2.toCharArray();

        int i1 = 0;
        int i2 = 0;

        int[] next = getNextArray(str2);

        while (i1<str1.length&&i2<str2.length){
            //如果字符串匹配,就继续往下比较
            if (str1[i1]==str2[i2]){
                i1++;
                i2++;
            }else if (next[i2]==-1){
                //可以看作str1和str2的第一个就不匹配
                i1++;
            }else {
                //求解出next数组后,再比较就相当于把str2的最大前缀的下一个字符和第一个不匹配的字符比较
                i2 = next[i2];
            }
        }

        return i2==str2.length ? i1-i2 : -1;
    }

    public static int[] getNextArray(char[] str2){

        if (str2.length==1){
            return new int[]{-1};
        }

        int[] next = new int[str2.length];
        //人为规定,next数组0为-1,1为0
        next[0] = -1;
        next[1] = 0;
        int pos = 2;
        int cn = 0;

        while (pos<next.length){
            if (str2[pos-1]==str2[cn]){
                //当前位置的next的值为++cn
                next[pos++] = ++cn;
            }else if (cn>0){
                //cn的值变成原cn的next数组的cn值
                cn = next[cn];
            }else {
                //该位置next为0
                next[pos++] =0;
            }
        }

        return next;
    }

扩展1:

问题:

给定一个字符串str1,只能往str1的后面添加字符变成str2。

要求1:str2必须包含两个str1,两个str1可以有重合,但是不能以同一个位置开头。

要求2:str2尽量短最终返回str2

思路:

1、利用next数组,求出包含字符串str1最后一个字符的最大相同前缀后缀;

例如abracadabra,其最大的相同前后缀是abra,长度是4,

2、向str1尾部添加从最大相同前缀后开始到结尾的子串;

例如,abracadabra+cadabra,即从下标4开始的子串添加到str1末尾,即是所求的str2。

此次的next数组大小不再是str1的长度,而是长度+1,因为要包含最后一个字符。

代码:

    public static String answer(String str){
        if (str==null||str.length()==0){
            return "";
        }
        char[] c = str.toCharArray();
        if (str.length()==1){
            return str+str;
        }

        if (str.length()==2){

            return c[0]==c[1 ]? (str+String.valueOf(c[0])) : (str+str);
        }

        int endNext = endNextLength(c);
        return str+str.substring(endNext);

    }

    public static int endNextLength(char[] chars){
        int[] next = new int[chars.length+1];
        int pos = 2;
        int cn = 0;
        next[0] = -1;
        next[1] = 0;
      while (pos<next.length){
            if (chars[pos-1]==chars[cn]){
                next[pos++]= ++cn;
            }else if (cn>0){
                cn = next[cn];
            }else {
                next[pos++] = 0;
            }
        }
        return next[next.length-1];
    }

扩展2

问题:

给定两个二叉树T1和T2,返回T1的某个子树结构是否与T2的结构相等。

思路:

1、将二叉树结构匹配问题转换成字符串匹配问题。

2、二叉树转换成字符串。将二叉树每个节点的值后面都添加一个特殊符号作为划定值边界的符号,如“!”,空节点用另一个特殊符号表示,如“#”,两个二叉树就转换为两个字符串。

eg
3
/ \
2 1

转换完成后就变成"3!2!#!#!1!#!#!"

代码

    public static class Node {
        public int value;
        public Node left;
        public Node right;

        public Node(int data) {
            this.value = data;
        }
    }

    public static boolean isSubtree(Node t1, Node t2) {
        String t1Str = serialByPre(t1);
        String t2Str = serialByPre(t2);
        return getIndexOf(t1Str, t2Str) != -1;
    }
        
      //
    public static String serialByPre(Node head) {
        if (head == null) {
            return "#_";
        }
        String res = head.value + "_";
        res += serialByPre(head.left);
        res += serialByPre(head.right);
        return res;
    }

    // KMP
    public static int getIndexOf(String s, String m) {
        if (s == null || m == null || m.length() < 1 || s.length() < m.length()) {
            return -1;
        }
        char[] ss = s.toCharArray();
        char[] ms = m.toCharArray();
        int[] nextArr = getNextArray(ms);
        int index = 0;
        int mi = 0;
        while (index < ss.length && mi < ms.length) {
            if (ss[index] == ms[mi]) {
                index++;
                mi++;
            } else if (nextArr[mi] == -1) {
                index++;
            } else {
                mi = nextArr[mi];
            }
        }
        return mi == ms.length ? index - mi : -1;
    }

    public static int[] getNextArray(char[] ms) {
        if (ms.length == 1) {
            return new int[] { -1 };
        }
        int[] nextArr = new int[ms.length];
        nextArr[0] = -1;
        nextArr[1] = 0;
        int pos = 2;
        int cn = 0;
        while (pos < nextArr.length) {
            if (ms[pos - 1] == ms[cn]) {
                nextArr[pos++] = ++cn;
            } else if (cn > 0) {
                cn = nextArr[cn];
            } else {
                nextArr[pos++] = 0;
            }
        }
        return nextArr;
    }

    public static void main(String[] args) {
        Node t1 = new Node(1);
        t1.left = new Node(2);
        t1.right = new Node(3);
        t1.left.left = new Node(4);
        t1.left.right = new Node(5);
        t1.right.left = new Node(6);
        t1.right.right = new Node(7);
        t1.left.left.right = new Node(8);
        t1.left.right.left = new Node(9);

        Node t2 = new Node(2);
        t2.left = new Node(4);
        t2.left.right = new Node(8);
        t2.right = new Node(5);
        t2.right.left = new Node(9);

        System.out.println(isSubtree(t1, t2));

    }
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容