算法1-无重复字符的最长子串

无重复字符的最长子串

给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。

示例 1:
输入: "abcabcbb"
输出: 3 
解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。
示例 2:

输入: "bbbbb"
输出: 1
解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。
示例 3:

输入: "pwwkew"
输出: 3
解释: 因为无重复字符的最长子串是 "wke",所以其长度为 3。
请注意,你的答案必须是 子串 的长度,"pwke" 是一个子序列,不是子串。

首先分析一下题目,求给定字符串的最长不重复子串,思路应该是分治不断降规模,把长度为n的字符串降为n-1的字符串的最长不重复子串,然后到n-2,.... 直到规模为1,关键在于如何得到递推式。

以pwwkew为例做初步分析 ,定义a[i][j]为子串s[i,j]的最长不重复子串,容易得出以下结论:

a[0][0] = len(p) = 1;

a[0][1] = len(pw) = 2;

a[1][2] = len(ww) = 1;

a[i][i] = 1;

字符串s(i,j)包含s(i,j-1)并且只比s(i,j-1)多一个字符s[j],

定义a[i][j] = a[i][j-1] + f(j);

a[i][j] 要么和a[i][j-1]相等,要么比a[i][j-1]多1,

f(j)返回值只能是0或者1,什么时候是1,第一感觉是s(i,j-1)不含字符s(j)的时候。

不过这个感觉是错的,比如pwwk,a[0][2]= len(pww)=2; s(0,2)不含s(3)也就是字符k,a[0][3]= len(pwwk)为2 。

进一步分析,f(j)= 1时,要具备一个条件,也就是s[i,j-1]的最长子串出现的位置必须是紧挨j的位置,

比如pwwk, s(0,2)出现最长子串是pw,而不是ww,a[0][3] != a[0][2] + 1;

再比如pwwke, s(0,3)最长子串是pw或者wk,s(0,4)为wke, a[0][4] = a[0][3] + 1; 因为紧挨s(4)也就是字符e的wk刚好也是s(0,3)的最长子串。

关于计算顺序,先计算单个字符,然后2个字符,然后3个字符,.... n个字符的最长子串。

根据上面分析,code如下

class Solution {
    int[][] a;
    int n;

    public int lengthOfLongestSubstring(String s) {
        // a[i,j] 定义为s[i,j]的最长子串的长度
        // a[i,j] = a[i,j-1] + s[i,j-1].contain(s[j]) ? 0 :1,

        n = s.length();
        a = new int[n][n];
        for (int i = 0; i < n; i++) {
            a[i] = new int[n];
        }
        int max = 0;
        for (int i = 0; i < n; i++) {
            for (int j = 0; j < n - i; j++) {
                a[j][j + i] = maxLength(s, j, j + i);
                if(max < a[j][j + i]){
                    max = a[j][j + i];
                }
            }
        }
        return max;
    }

    public int maxLength(String s, int i, int j) {
        if (i == j)
            return 1;
        return  contain(s, i, j - 1, j) + a[i][j - 1];

    }

    int max(int a, int b) {
        return a > b ? a : b;
    }

    int contain(String s, int l, int h, int z) {
        char ch = s.charAt(z);
        int maxLen = a[l][h];
        if(a[h-maxLen+1][h] == maxLen){
            for (int i = h; i >= h - maxLen+1; i--) {
                if (s.charAt(i) == ch) {
                    return 0;
                }
            }
            return 1;
        }
        return 0;      
    }
}

满心欢喜,折腾了半天终于完工了,拿来测试用例也都OK,平台提交一下.....😭超出内存限制(98/100),通过了97个用例,第98是一个几页纸长的一个字符串。

代码使用了n*n的int数组保存中间计算结果(n为字符串长度),当n非常大的时候.....
好吧,想办法减一点内存消耗。

其实二维数组有将近一半没有使用,真正用到的只有矩阵A[i,j]的(j>i部分)的半个矩阵

如pwwke的计算过程和结果如下,箭头表示计算过程,从长到短。


pwwke的计算过程和结果

矩阵的左下全都没用,这个应该算是稀疏矩阵吧,大学时期学好像有听过稀疏矩阵的压缩存储,不管了,很遥远了,尝试用一维数组来存储这矩阵,数组的长度为 n + (n-1) + ... + 1 = n*(n+1)/2 ,比 n ^2还是省很多了。

接下来就是坐标换算了, 二维的坐标换到一维
(i,j )---> index

求index(i,j)的表达式。
对照上面的图 (i为行数,j为列数)
index(i,j) = index(i,i) + j-i; // 先定位到第i行对角线位置,再偏移j-i
index(i, i)= n + (n-1) +...(n-i+1) = (2n-i+1) /2
index(i, j) = (2n-i+1) /2 + j-i

合并一下

index(i, j) =  i*(2n-1-i)/2 + j 

i = 0 时也满足。

好了,修改代码,把算法中的二维数组变成一维,修改后代码如下

int[] a;
int n;
int twoN_1; // 2n-1

public int lengthOfLongestSubstring(String s) {
    // a[i,j] 定义为s[i,j]的最长子串的长度
    // a[i,j] = a[i,j-1] + s[i,j-1].contain(s[j]) ? 0 :1,

    n = s.length();
    twoN_1 = 2*n -1;
    a = new int[n*(n+1)/2];
 
    //    j ---->
    // i  00 01 02 03 04
    // |  10 11 12 13 14
    // !  20 21 22 23 24
    // !  30 31 32 33 34 
    //    40 41 42 43 44
    // a[b][c] --> a[index];
    // index = i*(2n-1-i)/2 + j
    int max = 0;
    int tmpIndex = 0;

    for (int i = 0; i < n; i++) {
        for (int j = 0; j < n - i; j++) {
            tmpIndex = index(j,j+i);
            a[tmpIndex] = maxLength(s, j, j + i);
            if(max < a[tmpIndex]){
                max = a[tmpIndex];
            }
        }
    }
    return max;
}

public int index(int i,int j){
    return i * (twoN_1 -i) /2 +j;
}

public int maxLength(String s, int i, int j) {
    if (i == j)
        return 1;
    return  contain(s, i, j - 1, j) + a[index(i,j-1)];

}

int max(int a, int b) {
    return a > b ? a : b;
}

int contain(String s, int l, int h, int z) {
    char ch = s.charAt(z);
    int maxLen = a[index(l,h)];
    if(a[index(h-maxLen+1,h)] == maxLen){
        for (int i = h; i >= h - maxLen+1; i--) {
            if (s.charAt(i) == ch) {
                return 0;
            }
        }
        return 1;
    }
    return 0;      
}

这下应该行了吧,......... 生活总是残酷的,很多时候,努力了也不一定会有好的结果,还是超出内存限制。

看来得换另外的方式了,二维数组内存消耗太大了,尽管改成了一维,但本质上还是二维,那就来个真正的一维吧。

一顿分析猛如虎......

定义a[j]为 s(0,j)的最长子串, 真一维了,a[n-1] 为题目所求。

a[j] 与 a[j-1]的递推式跟上面一致,关键也是s(0,j-1)的最长子串是以j-1结尾的

s(0,j-1) 的最长子串长度为 max,如果s(j-max, j-1)这段长度为max的子串是s(0,j-1)的最长子串,即s(j-max, j-1)没有重复字符,而且如果s(j-max, j-1)不含字符s(j),则s(j-max, j) 是 s(0,j)的最长子串

那关键问题就是要判断s(j-max, j-1) 这一小段有没有重复了,s(j-max, j-1)有没有包含字符s[j]了,这个好说,弄一个HashSet来协助判断。

通过上面分析,形成新的代码如下

int []a;// a[i] 标示 s[0,i]的最大不重复子串长度
int n;
public int lengthOfLongestSubstring(String s) {
    n = s.length();
    a = new int[n];
    if(n == 0) return 0;
    a[0] = 1;
    for(int i=1;i<n;i++){
        a[i] = a[i-1] + fun(s,i);
    }
    return a[n-1];
}

HashSet<Character> hs = new HashSet();
// pwwk e  1 2 2 2
int fun(String s,int i){ // 返回0 || 1
    int h = i-1;
    int maxLen = a[h];
  
    char tmp;
    hs.clear();
    for(int j=h-maxLen+1 ;j<=h;j++){
        tmp = s.charAt(j);
        if(hs.contains(tmp))
           return 0;
        else hs.add(tmp);
    }

    return hs.contains(s.charAt(i)) ? 0 : 1;
}

这次提交通过了。

以上是笔者对这道理整个思考和解答过程,权且记录。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,457评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,837评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,696评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,183评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,057评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,105评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,520评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,211评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,482评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,574评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,353评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,897评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,489评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,683评论 2 335

推荐阅读更多精彩内容