@[TOC]([LeetCode解题报告] 522. 最长特殊序列 II )
一、 题目
1. 题目描述
- 最长特殊序列 II
难度:中等
给定字符串列表 <code>strs</code> ,返回其中 最长的特殊序列 。如果最长特殊序列不存在,返回 <code>-1</code> 。
特殊序列 定义如下:该序列为某字符串 独有的子序列(即不能是其他字符串的子序列)。
<code>s</code> 的 子序列可以通过删去字符串 <code>s</code> 中的某些字符实现。
- 例如,<code>"abc"</code> 是 <code>"aebdc"</code> 的子序列,因为您可以删除<code>"a<u>e</u>b<u>d</u>c"</code>中的下划线字符来得到 <code>"abc"</code> 。<code>"aebdc"</code>的子序列还包括<code>"aebdc"</code>、 <code>"aeb"</code> 和 <font face="Menlo, Monaco, Consolas, Courier New, monospace" color="#c7254e"><span style="font-size: 12.6px; background-color: rgb(249, 242, 244);">""</span></font> (空字符串)。
示例 1:
输入: strs = ["aba","cdc","eae"]
输出: 3
示例 2:
输入: strs = ["aaa","aaa","aa"]
输出: -1
提示:
- <code>2 <= strs.length <= 50</code>
- <code>1 <= strs[i].length <= 10</code>
- <code>strs[i]</code> 只包含小写英文字母
2. 原题链接
链接: 522. 最长特殊序列 II
二、 解题报告
1. 思路分析
这题难就难在下边这个显然
上,剩下的都是套路。
先说一个显然:
如果s的子序列ss是一个特殊序列,那么s更是特殊序列。
- 因此本题只需要判断每个字符串是否是其它字符串的子序列。
- 如果一个字符串不是任何一个其它字符串的子序列,这个字符串本身就是一个特殊序列,可以用来更新答案。
- 最后取所有特殊字符串的长度求max即可,没有就置-1.
子序列自动机
- 由于枚举每两个点对,因此对每个字符串,都要检查n-1个别的串是否是它的子序列(不剪枝的情况)。
- 对一个串多次检查子序列的方法,可以用到子序列自动机。
- 判断子序列的朴素方法是用双指针i,j。i在原串上,j在模式串上。我们发现i向右移动时,一定优先取最近的(即最早出现)、等于p[j]的字符,复每次最坏匹配复杂度 O(n+m)。
- 那么我们可以用dp的方式预处理出来每个字符下一个字符最早出现的位置,匹配时就可以直接i指针移动到下一个符合的字符,跳过大量无用比较。
- 自动机构造复杂度 O(mc)*,c=26即为字典长度,m是原串长度。每次匹配复杂度为 O(n)。
- 参考我的题解Python子序列自动机做法
2. 复杂度分析
- 显然枚举点对n^2是跑不了的。
- 设字符串平均长度为m。
- 双指针做法复杂度 T(n) = O(n×n×2m)
- 自动机做法,每个字符串只需要构造一次自动机,耗费m×26,然后剩下n-1个串去匹配耗费m, 因此复杂度T(n) = O(n×(m×26+n×m)) = O(n×n×m+n×m×26)
- 主要复杂度依然取决于外层n^2。
- 省的时间不多 diff = n×n×m - n×m×26
3. 代码实现
子序列自动机
。
class SubSequenceAuto:
def __init__(self,s,abc='abcdefghijklmnopqrstuvwxyz'):
self.s,self.abc = s,abc
self.n,abc_len = len(s),len(abc)
self.abc_index = {v:k for k,v in enumerate(abc)}
self.dp = [[self.n]*abc_len for _ in range(self.n+1)]
dp = self.dp
# dp.append([self.n]*abc_len)
for i in range(self.n-1,-1,-1):
dp[i] = dp[i+1][:]
dp[i][self.abc_index[s[i]]] = i
# for j in range(abc_len):
# dp[i][j] = i if s[i]==abc[j] else dp[i+1][j]
def query_is_sub_seq(self,t):
dp = self.dp
abc_index = self.abc_index
n = self.n
r = 0
for c in t:
r = dp[r][abc_index[c]]
if r == n:
return False
r += 1
return True
class Solution:
def findLUSlength(self, strs: List[str]) -> int:
"""
先说一个显然:如果s的子序列ss是一个特殊序列,那么s更是特殊序列。
因此本题只需要判断每个字符串是否是其它字符串的子序列。
判断子序列可以双指针,或者用子序列自动机。
"""
n = len(strs)
flags = [True] * n # 每个字符串是否是特殊序列,初始化为0。如果他是别人的子序列,则置False
# 以下判断j是不是i的子序列
for i in range(n):
sba = SubSequenceAuto(strs[i])
for j in range(n):
if i == j or flags[j] ==False:
continue
if sba.query_is_sub_seq(strs[j]):
flags[j] = False
ans = -1
for i in range(n):
if flags[i]:
ans = max(ans,len(strs[i]))
return ans
三、 本题小结
子序列自动机的做法可以优化判断子序列的时间,当字符串长度非常大时,优势才明显。但这题数据较弱,因此优势不明显。
有时间把子序列自动机模板写一下。
四、 参考链接
- 前置题: 392. 判断子序列
人生苦短,我用Python!