奇怪的后缀数组计数。
题意:给定 $m$ 中互不相同的字符,每一个字符有 $c_i$ 个,问所有由这些字符组成的长度为 $n$ 的字符串中,不同的后缀数组有多少个。对 $10 ^ 9 + 7$ 取模,$n, m\leq 500$。
后缀数组是不好统计的,考虑如何将后缀数组转化为其他的一些东西。注意到我们可以把后缀数组不同位置的关系一一找出来,那么 $n$ 个字符就可以转化为一个不等式链。具体的,如果 $sa_{i + 1} + 1$ 排名比 $sa_i + 1$ 小,那么 $s_{sa_i} < s_{sa_{i + 1}}$,否则 $s_{sa_i}\leq s_{sa_{i + 1}}$。
注意到一个“满”的不等式链一定和一个后缀数组形成双射,其中“满”表示每一处的 $<$ 都确实是 $<$,不能变成 $\leq$。
现在我们就可以通过不等式链的方案数来反向计算后缀数组的个数。假设我们已经出现了 $k - 1$ 个 $<$,将原不等式链分成了 $k$ 段,分别为 $a_1, a_2\cdots, a_k$,那么不等式链的方案数就是 $\dfrac{n!}{\prod_{i = 1} ^ k a_i!}$。
这样看似很对,但是注意到一个问题:我们在计算 $k$ 段的时候,可能中间某些 $<$ 是不必要的,也就是说,在某些情况下,这个 $<$ 其实是一个 $\leq$,它并不是“满”的。这样就有可能算重了,因为不是“满”的就有可能被“满”的方案重新算一次,而这两个对应的后缀数组又是相同的。
另外一个可能算重的地方就是如果 $c_i$ 未用完,但是 $i$ 和 $i + 1$ 的交界处确实用的是 $\leq$,那么这个也是算重了的,因为我们可以把 $i + 1$ 替换成 $i$,这样就会算重。
接下来我们考虑刚才的 $\leq$ 和 $<$ 的算重问题。因为我们无法限制某一个位置一定是 $<$,所以只好考虑容斥,如果我们把 $x$ 个 $<$ 强制变为了 $\leq$,那么贡献需要乘上 $(-1) ^ x$。
接下来的事情就是比较套路的 DP 优化容斥了。设 $f(i, j, k)$ 表示考虑到第 $i$ 个字符,目前长度为 $j$,最后一段 $\leq$ 链长度为 $k$ 的方案数。注意我们这里使用类似于 EGF 的办法,先把所有的 $\dfrac{1}{a_i!}$ 乘起来,最后乘 $n!$。考虑转移:
- 正常的把这一段 $c_i$ 个全部接在前面 $\leq$ 链上:$f(i, j, k) \times 1\to f(i + 1, j + c_i, k + c_i)$。
- 可能只选择一部分,直接将该 $\leq$ 链正常结束:$f(i, j, k)\times \dfrac1{(k + l)!}\to f(i + 1, j + l, 0)$,其中 $l\in [0, c_i]$。
- 可能只选择一部分,本应该是 $<$,但是容斥为 $\leq$:$f(i, j, k) \times -1\to f(i + 1, j + l, k + l)$。
直接转移是 $O(n ^ 3 m)$ 的,可以考虑前缀和,把 $(j, k)$ 看作二维平面,那么第 2、3 部分计算的都是对角线的一部分,按照对角线方向前缀和即可做到 $O(n ^ 2m)$,可以通过。
不得不说,这道题后缀数组转化为不等式链的方法还是很巧妙的,另外 DP 优化容斥还是一个不错的题目。注意 $c_i = 0$ 时需要跳过,不然可能出现奇怪的无法转移的错误。
1 | int main() |