NKOJ 2993 (NOI 2014)动物园(KMP+栈)

P2993【NOI2014 Day2】动物园

问题描述

近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。
某天,园长给动物们讲解KMP算法。
园长:“对于一个字符串S,它的长度为L。我们可以在O(L)的时间内,求出一个名为next的数组。有谁预习了next数组的含义吗?”
熊猫:“对于字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作next[i]。”
园长:“非常好!那你能举个例子吗?”
熊猫:“例S为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出next[1] = next[2] = next[3] = 0,next[4] = next[6] = 1,next[7] = 2,next[8] = 3。”
园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)的时间内求出next数组。
下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如S为aaaaa,则num[4] = 2。这是因为S的前4个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’,但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”
最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?
特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出$\prod_{i=1}^{L}(num[i]+1)$对1,000,000,007取模的结果即可。
其中$\prod_{i=1}^{L}(num[i]+1)=(num[1]+1)\times (num[2]+1)\times …\times (num[L]+1)$

输入格式

第1行仅包含一个正整数n,表示测试数据的组数。
随后n行,每行描述一组测试数据。每组测试数据仅含有一个字符串S,S的定义详见题目描述。
数据保证S中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。

输出格式

包含n行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。
对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对1,000,000,007取模的结果。输出文件中不应包含多余的空行。

样例输入

3
aaaaa
ab
abcababc

样例输出

36
1
32

数据范围
这里写图片描述


总结一下题意,我们需要求对于以$i$位置为末尾的子串,他的所有长度小于等于$\frac{i}{2}$的前缀和后缀中相同的串的个数。

回忆$KMP$算法中$fail[i]$的意义,他表示以$i$号位置为结尾的子串的前缀和后缀中最长的相等的串。

我们来看看对于一个位置$i$,$fail[i]$位置表示的子串肯定既是$i$的前缀,也是$i$的后缀,那么$fail[fail[i]]$表示的子串呢,容易发现他肯定也是$i$的前缀和$i$的后缀,同时由于$fail$数组记录的是最长的子串,那么$fail[fail[i]]$表示的肯定是$i$的前缀和后缀中长度第二长的子串。

那么问题的解就比较显然了,我们需要求$fail$链上,编号小于等于$\frac {i}{2}$的编号个数。

暴力一点就直接用$while$循环算。
但事实上,如果将$fail[i]$作为$i$的父亲,那么$fail$数组就形成了一棵树。那么我们就可以在遍历树的过程中用树状数组来维护。这样大概能得80分。
事实上,我们可以更快一点,观察发现,$fail$链上的编号是递增的,那么$num[i]>=num[fail[i]]$,那么我们可以每次直接将$num[i]$赋值为$num[fail[i]]$,然后用栈暴力增加$num[i]$,由于每个数最多被讨论到一次,均摊复杂度$O(n)$
具体实现可以参考代码。


代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
#include<stdio.h>
#include<iostream>
#include<algorithm>
#include<cstring>
#define N 1000005
#define ll long long
using namespace std;
char A[N];
int n,l,F[N],B[N],S[N],top;
int TOT,LA[N],NE[N],EN[N];
ll ans,mod=1000000007LL;
void DFS(int x)
{
S[++top]=x;
B[x]=B[F[x]];
while(B[x]<top-1&&(S[B[x]+1]<<1)<=x)B[x]++;//暴力更新
for(int i=LA[x];i;i=NE[i])DFS(EN[i]);
top--;
}
void ADD(int x,int y)
{
TOT++;
EN[TOT]=y;
NE[TOT]=LA[x];
LA[x]=TOT;
}
int main_main()
{
int i,j,n;
scanf("%d",&n);
while(n--)
{
memset(LA,0,sizeof(LA));
ans=1;TOT=0;
scanf("%s",&A[1]);A[0]='%';
l=strlen(A)-1;j=0;
for(i=2;i<=l;i++)
{
while(j>0&&A[i]!=A[j+1])j=F[j];
if(A[i]==A[j+1])j++;
F[i]=j;
}
for(i=1;i<=l;i++)ADD(F[i],i);
DFS(0);
for(i=1;i<=l;i++)ans=ans*B[i]%mod;
printf("%lld\n",ans);
}
}
const int main_stack=16;
char my_stack[128<<20];
int main() {
__asm__("movl %%esp, (%%eax);\n"::"a"(my_stack):"memory");
__asm__("movl %%eax, %%esp;\n"::"a"(my_stack+sizeof(my_stack)-main_stack):"%esp");
main_main();
__asm__("movl (%%eax), %%esp;\n"::"a"(my_stack):"%esp");
return 0;
}