给出一个字符串s和一个词典,判断字符串s是否可以被空格切分成一个或多个出现在字典中的单词。
样例
给出s = "lintcode",dict = ["lint","code"],返回 true 因为"lintcode"可以被空格切分成"lint code"
思路
动态规划的本质:根据已知结论推理未知结论
s = lintcode 可以分为 l和intcode,若是l是可分割单词,并且intcode单词在dict中,则表示s也是可分割单词。
若不符合,s = lintcode 可以分为 li和ntcode,若是li是可分割单词,并且ntcode单词在dict中,则表示s也是可分割单词。
...
同理得出BWord[ n ]表示字符串S[0,n]是否是可分割单词,是则为true,否为false。
BWord[ n ] = BWord[ i ] &&( S[ i+1 ,n ]在dict中 )
参考
代码
- 会超时的DP
public class Solution {
/*
* @param s: A string
* @param dict: A dictionary of words dict
* @return: A boolean
*/
public boolean wordBreak(String s, Set<String> dict) {
boolean[] canSegment = new boolean[s.length() + 1];
canSegment[0] = true;
for (int i = 1; i <= s.length(); i++) {
for (int j = 0; j < i; j++) {
if (canSegment[j] && dict.contains(s.substring(j, i))) {
canSegment[i] = true;
break;
}
}
}
return canSegment[s.length()];
}
}
- 优化过的DP
第二种DP优化思路是算出字典中长度最长的字符串, i - j 的长度不可能超过最大长度,虽然仍是采用两层 for 循环做,但方法2的第二层循环规模不超过字典最长单词长度,相比于字符串长度的规模,显然要小很多
public class Solution {
private int getMaxLength(Set<String> dict) {
int maxLength = 0;
// 得到字典中单词的最大长度
for (String word : dict) {
maxLength = Math.max(maxLength, word.length());
}
return maxLength;
}
public boolean wordBreak(String s, Set<String> dict) {
if (s == null || s.length() == 0) {
return true;
}
int maxLength = getMaxLength(dict);
boolean[] canSegment = new boolean[s.length() + 1];
// 初值,使canSegment[1]对应第一个字母,方便阅读
canSegment[0] = true;
for (int i = 1; i <= s.length(); i++) {
canSegment[i] = false;
for (int lastWordLength = 1;
lastWordLength <= maxLength && lastWordLength <= i;
lastWordLength++) {
// 找到去掉某个长为lastWordLength的单词后,从0到i - lastWordLength位置的字符串是满足切分条件的
if (!canSegment[i - lastWordLength]) {
continue;
}
// 判断去掉的单词是不是在字典中
/* substring(int beginIndex, int endIndex)
* 从beginIndex开始取,到endIndex结束
* 从0开始数,其中不包括endIndex位置的字符
*/
String word = s.substring(i - lastWordLength, i);
if (dict.contains(word)) {
canSegment[i] = true;
break;
}
}
}
return canSegment[s.length()];
}
}