【NOI2016】优秀的拆分
问题描述
如果一个字符串可以被拆分为 $\text{AABB}$ 的形式,其中 $\text{A}$ 和 $\text{B}$ 是任意非空字符串,则我们称该字符串的这种拆分是优秀的。
例如,对于字符串 $ \texttt{aabaabaa} $ ,如果令 $\text{A}=\texttt{aab}$,$\text{B}=\texttt{a}$,我们就找到了这个字符串拆分成 $\text{AABB}$ 的一种方式。一个字符串可能没有优秀的拆分,也可能存在不止一种优秀的拆分。
比如我们令 $\text{A}=\texttt{a}$,$\text{B}=\texttt{baa}$,也可以用 $\text{AABB}$ 表示出上述字符串;但是,字符串 $\texttt{abaabaa}$ 就没有优秀的拆分。现在给出一个长度为 $n$ 的字符串 $S$,我们需要求出,在它所有子串的所有拆分方式中,优秀拆分的总个数。这里的子串是指字符串中连续的一段。
以下事项需要注意:
- 出现在不同位置的相同子串,我们认为是不同的子串,它们的优秀拆分均会被记入答案。
- 在一个拆分中,允许出现 $\text{A}=\text{B}$。例如 $\texttt{cccc}$ 存在拆分 $\text{A}=\text{B}=\texttt{c}$。
- 字符串本身也是它的一个子串。
输入格式
每个输入文件包含多组数据。
输入文件的第一行只有一个整数 $T$,表示数据的组数。
接下来 $T$ 行,每行包含一个仅由英文小写字母构成的字符串 $S$,意义如题所述。
输出格式
输出 $T$ 行,每行包含一个整数,表示字符串 $S$ 所有子串的所有拆分中,总共有多少个是优秀的拆分。
样例输入
4
aabbbb
cccccc
aabaabaabaa
bbaabaababaaba
样例输出
3
5
4
7
提示
对于全部的测试点,$1 \leq T \leq 10, \ n \leq 30000$。
考虑枚举$AA$与$BB$的分界,令$A[i]$表示以$i$结尾的形如$AA$的串的个数,$B[i]$表示以$i$开头的形如$BB$的串的个数,那么$Ans=\sum A[i]\times B[i+1]$
那么考虑如何求出$A[i]$和$B[i]$,下面只讨论$A[i]$,$B[i]$同理。
考虑一个长为$2L$的形如$AA$的串,那么该串一定经过形如了$s[iL]$和$s[(i+1)L]$两个位置,我们考虑先枚举$L$,再枚举$pos=iL$,那么算出$s[iL],s[(i+1)L]$往前后分别能匹配多长,假设往前能匹配的长度位$pre(包含iL)$,往后能匹配的长度为$suf(包含iL)$,那么可以发现在区间$[(i+1)L-pre+L,(i+1)L+suf-1]$都可以作为一个$AA$串的结尾。因此只需要区间$+1$即可。这里可以用差分数组来做。
但是注意到直接这样算会出现重复,因此最后的区间左端点应该是$max{(i+1)L-pre+L,(i+1)L}$,区间右端点应该是$min{(i+1)L+suf-1,(i+2)L-1}$
最后,处理往前和往后的匹配长度时,可以用后缀自动机或后缀数组处理,也可以直接用哈希+二分解决,复杂度都差不多。
代码:
1 |
|